2025年09月20日(土)に開催された オープンセミナー2025@香川での発表資料です。
## 内容
DuckDBは、PostgreSQL(OLTP)とは異なり、分析処理(OLAP)に特化した軽量な組み込み型データベースです。
数百GB単位のデータを、列指向の特性と「慣れ親しんだSQL」を用いて、高速かつシンプルに処理します。
S3上のParquetやローカルのCSV/JSONなど多様なデータソースを依存関係なく直接扱える点が大きな強みです。
本セッションでは、DuckDBがデータ分析を再び高速で楽しいものにするというテーマのもと、その基本と高速分析の仕組み、S3代替や軽量BIツールとしての活用事例を深掘りします。
また、PostgreSQLの拡張機能pg_duckdbを紹介します。
これは、PostgreSQLのプロセス内にDuckDBエンジンを組み込み、劇的な性能向上(特定ベンチマークで1500倍)を実現できるアプローチです。技術の特性を理解し、トップスピードでのデータ分析を実現する工夫を学びましょう。
話すこと
1. DuckDBとは何か?(軽量組み込み型DB、OLAP特化、高速性の秘訣)
2. pg_duckdbの紹介(OLTP/OLAPの使い分けとpg_duckdbの基本)
3. PostgreSQL + DuckDB統合のアプローチ(pg_duckdbとDuckDB PostgreSQL Extensionの違い)
4. 終わりに