ベクトルデータベースあれこれ～RAGのために～

© 2025 Masashi Murakami All Right Reserved. 1 ベクトルデータベースあれこれ～RAGのために～
2025/07/11 村上　將志

© 2025 Masashi Murakami All Right Reserved. 3 ベクトルデータベースって？定義：情報を数値の配列（ベクトル）として保存するデータベースです。従来のデータベースが文
字や数字をそのまま保存するのに対し、意味や特徴を数値化して保存します。できること：文章、画像、音声などの類似性を高速で検索できます。「この商品に似た商品を探す」「この質問と関連する情報を見つける」といった、「意味的な近さ」での検索が可能です。活用例：ECサイトでの類似商品表示、検索エンジンでの質問意図理解、ユーザー好みに基づく推薦システム、AIチャットボットでの関連情報検索、RAG（AIが関連文書を検索して最新情報で回答生成）など。AIと組み合わせることで、より賢い検索や推薦を実現する重要な技術です。 by Claude.ai

© 2025 Masashi Murakami All Right Reserved. 4 そもそも、RAGって？ RAGは、Retrieval-Augmented
Generationの略で、「検索拡張生成」と略されます。 RAGは、AI が質問に答える際に、事前に用意されたデータベースから関連情報を検索し、その情報を参考にして回答を生成する技術です。 RAGを使うことで、AIは最新の企業情報や専門知識を正確に反映した回答ができるようになります。また、根拠となる情報源を示せるため、信頼性の高い対話が可能です。活用例として、社内FAQ システムがあります。従業員が「有給申請の方法は？」と質問すると、 RAGシステムが社内規定から該当部分を検索し、最新のルールに基づいて正確な手続きを案内します。他にも、カスタマーサポート、医療相談、法律相談など、専門知識が必要な分野で広く活用されています。RAGにより、AIがより実用的で信頼できるアシスタントとして機能します。 by Claude.ai

© 2025 Masashi Murakami All Right Reserved. 5 RAG（検索拡張生成）の仕組み RAG
Retrieval-Augmented Generation （）完全フロー DB 準備フェーズ：ドキュメントのベクトル化と構築社内ドキュメント PDF 📄 Excel 📊 Word 📝 Web 🌐 チャンク分割文書を小さなセクションに分割 512 2048 （〜文字）オーバーラップ設定 Embedding Model OpenAI 🤖 text-embedding-3 または多言語モデルベクトル表現生成 [0.1, -0.3, 0.8, ...] 1536 次元ベクトル意味を数値化 DB ベクトル Pinecone 🗃️ Weaviate ChromaDB : 完了後の状態すべての文書がベクトル化され、検索可能な状態でベクトルデータベースに格納完了準備フェーズの特徴 • 一度だけ実行（文書更新時のみ再実行） • バッチ処理で時間をかけて高品質なベクトル化 • チャンクサイズやオーバーラップの最適化が重要実行フェーズ：リアルタイム検索と回答生成 👤 ユーザー質問 ◦◦ 「について教えて」質問をベクトル化準備フェーズと同じ Embedding モデル使用 DB ベクトル類似度検索コサイン類似度ユークリッド距離等関連文書抽出 Top-K 件の類似文書を取得 K=3 10 （通常〜）プロンプト構築システム指示：「以下の情報を参考に、正確に質問に答えてください。情報に含まれていない内容は推測せず、『記載されていません』と回答してください。」 [ ] コンテキスト：検索された関連文書の内容 [ ] ユーザー質問：元の質問回答： LLM 生成用 GPT-4 🤖 Claude Gemini Llama 等根拠のある回答生成 • 検索された社内情報に基づく正確な回答 • 参考文書の引用やソース明記 • 最新情報を反映 • ハルシネーション（誤情報生成）の軽減 • 情報が不足する場合は明確に伝達ユーザーに回答チャット 💬 メール 📧 Web UI 🌐 API 応答 📱 実行フェーズの特徴 • リアルタイム処理（数秒以内） • ユーザーごとの質問に対応 • Top-K プロンプト設計と設定が回答品質を左右 DB 同じベクトルを使用 by Claude.ai

DB 準備フェーズ：ドキュメントのベクトル化と構築データの前処理とベクトル化社内ドキュメント PDF 📄 Excel 📊 Word 📝 Web 🌐 チャンク分割文書を小さなセクションに分割 512 2048 （〜文字）オーバーラップ設定 Embedding Model OpenAI 🤖 text-embedding-3 または多言語モデルベクトル表現生成 [0.1, -0.3, 0.8, ...] 1536 次元ベクトル意味を数値化 DB ベクトル Pinecone 🗃️ Weaviate ChromaDB : 完了後の状態すべての文書がベクトル化され、検索可能な状態でベクトルデータベースに格納完了 by Claude.ai

実行フェーズ：検索と生成リアルタイム検索と回答生成 👤 ユーザー質問 ◦◦ 「について教えて」質問をベクトル化準備フェーズと同じ Embedding モデル使用 DB ベクトル類似度検索コサイン類似度ユークリッド距離等関連文書抽出 Top-K 件の類似文書を取得 K=3 10 （通常〜）プロンプト構築システム指示：「以下の情報を参考に、正確に質問に答えてください。情報に含まれていない内容は推測せず、『記載されていません』と回答してください。」 [ ] コンテキスト：検索された関連文書の内容 [ ] ユーザー質問：元の質問回答： LLM 生成用 GPT-4 🤖 Claude Gemini Llama 等根拠のある回答生成 • 検索された社内情報に基づく正確な回答 • 参考文書の引用やソース明記 • 最新情報を反映 • ハルシネーション（誤情報生成）の軽減 • 情報が不足する場合は明確に伝達ユーザーに回答チャット 💬 メール 📧 Web UI 🌐 API 応答 📱 : 処理時間 ⚡ LLM 通常数秒以内でリアルタイム回答（ベクトル検索は高速、生成が主な処理時間） by Claude.ai

© 2025 Masashi Murakami All Right Reserved. 9 ベクトルデータベースの選択肢オープンソースのベクトルデータベースとして、下記を比較します。
• Chroma • MySQL • Elasticsearch • Apache Solr • pgvector

© 2025 Masashi Murakami All Right Reserved. 10 利用方法調査データベースに複数の文字列を登録し、キーワードで検索して類似性の高いデータを取得するため
のプログラムをJupyter Notebookの形式で作成します。主に行う処理は、 • 埋め込みモデル（Embeddings）の定義 • 文字列を埋め込みモデルでベクトル化し、元の文字列とともにデータベースへ登録 • キーワードと件数を指定して検索し、類似性の高い情報から並べて表示 – ※RDBMSでいう、 SELECT * FROM *** WHERE *** LIKE ‘%キーワード%’ LIMIT 2; （キーワードを含む(近い)データを2件取得する的な検索ができるか？とします。

© 2025 Masashi Murakami All Right Reserved. 11 利用方法調査 RAG構築調査のためのDocker環境定義、Jupyter
Notebookファイルなどを https://github.com/murakami0923/llm-rag-examples/tree/develop に入れてあります。 ※現在、「develop」ブランチで作成中

© 2025 Masashi Murakami All Right Reserved. 13 Chroma •
LLMを扱うアプリケーション向けにカスタマイズされた、オープンソースのベクトルデータベースです。 • ライセンスは、Apache License 2.0です。 • LangChain、LangGraph等でRAGを構築するなどのハンズオンでも、Chromaが使われることが多いです。

© 2025 Masashi Murakami All Right Reserved. 14 Chroma サンプル：chromadb-ex01.ipynb
特徴： • 特にサーバ等を用意することなく、簡単に利用できます。 • ベクトルデータベースは、サンプルではメモリ上に展開されます。 – ※永続化も可能なようですが、まだ試していません。 • 検索の際、取得するデータの数を指定できます。 – ※スコア値の高いものから順に取得できます。

© 2025 Masashi Murakami All Right Reserved. 16 MySQL •
オープンソースのRDBMSです。 • ライセンスは、GPL v2または商用ライセンスです。 • MySQL 9.0で、「VECTOR」型がサポートされ、ベクトルデータを扱うことができるようになりました。

© 2025 Masashi Murakami All Right Reserved. 17 MySQL サンプル：
• テーブル定義：init-db.sql • 登録処理：mysql9-vector-ex01-01-insert.ipynb • 検索処理：mysql9-vector-ex01-02-search.ipynb 特徴： • ドキュメントの文字列を埋め込みモデルでベクトル化し、元の文字列とともにinsertします。 • 検索の際は全レコードを検索する必要があります。 – 検索キーワードのベクトル化、および、検索キーワードとドキュメントの文字列の類似性はDB自体の機能にはないため。 – MySQL HeatWaveでは、DBの機能でベクトル化がサポートされているため、検索の際にソートして任意の数を取得できるようです。

© 2025 Masashi Murakami All Right Reserved. 19 Elasticsearch •
Elastic社が開発している、分散マルチテナント対応検索エンジンです。 • ライセンスは、8.16以降はAGPLv3下で利用できるオープンソース、あるいは、商用ライセンスから選択します。 – 以前はソースアベイラブル・ソフトウェアだった経緯もあり、ライセンスの扱いが流動的です。 • Elasticsearch 8.0以降でベクトル検索がサポートされ、その後改良が行われ、オプションや検索クエリの書き方が追加されてきました。

© 2025 Masashi Murakami All Right Reserved. 20 Elasticsearch（REST API）
サンプル： • 登録処理：elasticsearch-vector-ex01-01-request-insert.ipynb • 検索処理：elasticsearch-vector-ex01-02-request-search.ipynb 特徴： • Elasticsearchクライアントもありますが、Elasticsearchバージョンアップ後にクライアントの対応まで時間がかかることがあり、REST APIでの操作を推奨する旨、サポートやコミュニティで議論されているようなので、こちらではREST APIをrequestで操作しています。 • ドキュメントの文字列を埋め込みモデルでベクトル化し、元の文字列とともにインデックスします。 • 検索の際、取得するデータの数を指定できます。 – ※k近傍法で類似性の高いものから順に取得できます。

© 2025 Masashi Murakami All Right Reserved. 21 Elasticsearch（Elasticsearchクライアント）サンプル：
• 登録処理：elasticsearch-vector-ex02-01-es-client-insert.ipynb • 検索処理：elasticsearch-vector-ex02-02-es-client-search.ipynb 特徴： • Elasticsearchおよびクライアントのバージョンを 8.18.0 で統一し、前述のREST APIで行ったのと同じ処理を、クライアントライブラリで操作しています。 • ドキュメントの文字列を埋め込みモデルでベクトル化し、元の文字列とともにインデックスします。 • 検索の際、取得するデータの数を指定できます。 – ※k近傍法で類似性の高いものから順に取得できます。

• Apacheソフトウェア財団が開発している、全文検索エンジンです。 • ライセンスは、Apache License 2.0です。 • Solr 9からベクトル検索機能が導入されました。

サンプル： • 前処理：solr-vector-ex01-00-prepare.ipynb • 登録処理：solr-vector-ex01-01-insert.ipynb • 検索処理：solr-vector-ex01-02-search.ipynb 特徴： • 前処理として、コア、コレクションを作成し、スキーマ設定（フィールド追加）をします。 – フィールド追加時、使用するEmbeddingに応じて、次元数を指定する必要があります。 • ドキュメントの文字列を埋め込みモデルでベクトル化し、元の文字列とともにインデックスします。 • 検索の際、取得するデータの数を指定できます。 – ※k近傍法で類似性の高いものから順に取得できます。

サンプル： • 登録処理：pgvector-ex01-1-insert.ipynb • 検索処理：pgvector-ex01-2-search.ipynb 特徴： • ドキュメントの文字列を埋め込みモデルでベクトル化し、元の文字列とともにinsertします。 • 検索の際、 – embedding <-> %s::vector で、データのベクトルと検索キーワードのベクトルのコサイン距離を算出できます。（%sの部分に検索キーワードをEmbeddingでベクトル化したものを渡します） • この値でソートすることで、近いものから順に取得できます。 – 取得するデータの数を指定できます。

© 2025 Masashi Murakami All Right Reserved. 29 さいごに検証してきたデータベースについてまとめます。
ライセンス永続化キーワード指定検索件数指定 Chroma Apache License 2.0 △ ※デフォルト：インメモリー ◦ ◦ MySQL GPL v2 or 商用 ※利用方法により決定される ◦ × × Elasticsearch AGPL v3 or 商用 ※ライセンスを選択 ※流動的 ◦ ◦ ◦ Apache Solr Apache License 2.0 ◦ ◦ ◦ pgvector The PostgreSQL License ◦ ◦ ◦

© 2025 Masashi Murakami All Right Reserved. 30 今後挑戦したいこと •
BacklogのWikiページ等にある社内のドキュメントのデータベース化を試みます。 • ドキュメントをチャンクに分割し、検索精度の向上を試みます。 – どのように分割するか（改行の連続？句読点？）など、試行錯誤が必要だと考えます。 • ローカルのLLM（Ollama）あるいは外部LLMと連携し、LangChain、LangGraph等を用いて RAGの構築を試みます。 • 2025年に入って、RAGだけじゃなくて、CAGなんていう物も出てきたらしいので、試しry)

ベクトルデータベースあれこれ～RAGのために～

ベクトルデータベースあれこれ～RAGのために～

murakami0923

More Decks by murakami0923

Featured

Transcript

© 2025 Masashi Murakami All Right Reserved. 1 ベクトルデータベースあれこれ～RAGのために～

© 2025 Masashi Murakami All Right Reserved. 2 ベクトルデータベースって？

© 2025 Masashi Murakami All Right Reserved. 3 ベクトルデータベースって？定義：情報を数値の配列（ベクトル）として保存するデータベースです。従来のデータベースが文

© 2025 Masashi Murakami All Right Reserved. 4 そもそも、RAGって？ RAGは、Retrieval-Augmented

© 2025 Masashi Murakami All Right Reserved. 5 RAG（検索拡張生成）の仕組み RAG

© 2025 Masashi Murakami All Right Reserved. 6 RAG（検索拡張生成）の仕組み RAG

© 2025 Masashi Murakami All Right Reserved. 7 RAG（検索拡張生成）の仕組み RAG

© 2025 Masashi Murakami All Right Reserved. 8 各ベクトルデータベースと利用方法調査

© 2025 Masashi Murakami All Right Reserved. 9 ベクトルデータベースの選択肢オープンソースのベクトルデータベースとして、下記を比較します。

© 2025 Masashi Murakami All Right Reserved. 10 利用方法調査データベースに複数の文字列を登録し、キーワードで検索して類似性の高いデータを取得するため

© 2025 Masashi Murakami All Right Reserved. 11 利用方法調査 RAG構築調査のためのDocker環境定義、Jupyter

© 2025 Masashi Murakami All Right Reserved. 12 Chroma

© 2025 Masashi Murakami All Right Reserved. 13 Chroma •

© 2025 Masashi Murakami All Right Reserved. 14 Chroma サンプル：chromadb-ex01.ipynb

© 2025 Masashi Murakami All Right Reserved. 15 MySQL

© 2025 Masashi Murakami All Right Reserved. 16 MySQL •

© 2025 Masashi Murakami All Right Reserved. 17 MySQL サンプル：

© 2025 Masashi Murakami All Right Reserved. 18 Elasticsearch

© 2025 Masashi Murakami All Right Reserved. 19 Elasticsearch •

© 2025 Masashi Murakami All Right Reserved. 20 Elasticsearch（REST API）

© 2025 Masashi Murakami All Right Reserved. 21 Elasticsearch（Elasticsearchクライアント）サンプル：

© 2025 Masashi Murakami All Right Reserved. 22 Apache Solr

© 2025 Masashi Murakami All Right Reserved. 23 Apache Solr

© 2025 Masashi Murakami All Right Reserved. 24 Apache Solr

© 2025 Masashi Murakami All Right Reserved. 25 pgvector

© 2025 Masashi Murakami All Right Reserved. 26 pgvector •

© 2025 Masashi Murakami All Right Reserved. 27 Apache Solr

© 2025 Masashi Murakami All Right Reserved. 28 さいごに

© 2025 Masashi Murakami All Right Reserved. 29 さいごに検証してきたデータベースについてまとめます。

© 2025 Masashi Murakami All Right Reserved. 30 今後挑戦したいこと •

© 2025 Masashi Murakami All Right Reserved. 31 ありがとうございました。

ベクトルデータベースあれこれ ～RAGのために～

ベクトルデータベースあれこれ ～RAGのために～

More Decks by murakami0923

Featured

Transcript

ベクトルデータベースあれこれ～RAGのために～

ベクトルデータベースあれこれ～RAGのために～