Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Db2 LUW 12.1でベクトル検索をしてみよう - Part1: LangChain編/2...

Avatar for Mayumi Hirano Mayumi Hirano
September 03, 2025

Db2 LUW 12.1でベクトル検索をしてみよう - Part1: LangChain編/20250903_db2vector_part1_langchain

2025/09/03(水)オンライン開催
Db2 LUW 12.1でベクトル検索をしてみよう - Part1: LangChain編
https://ibm-developer.connpass.com/event/365450/
の資料です。

【内容】『Db2 LUW 12.1でベクトル検索をしてみよう - Part1: LangChain編』

Db2 12.1.2では、AIセマンティック検索に不可欠なベクトル・データを入れてSQL文で照会できるようになりました。
さらに、LangChainでも使えます。

新しいVECTORデータ型を使用すると、従来の表データと一緒にベクトル・データを保存および管理できるため、生成AIと組み合わせて使われる RAG (Retrieval Augmented Generation) などに利用可能です。

今回は、Db2とLangChainでベクトル検索をしてみましょう。

今回のデモでは以下を使用します:
- Db2/Linux 12.1.2
- Python
- LangChain

Avatar for Mayumi Hirano

Mayumi Hirano

September 03, 2025
Tweet

More Decks by Mayumi Hirano

Other Decks in Technology

Transcript

  1. IBM Database Dojo 2025 Db2 LUW 12.1でベクトル検索をしてみ よう- Part1: LangChain編

    平野 真弓 Mayumi Hirano 日本アイ・ビー・エム株式会社 テクノロジー事業本部 西戸 京子 Kyoko Nishito
  2. 2 Db2 12.1.2 ハイライト - ベクトルサポート • Db2 12.1.2 エンジン機能であるため、Db2エンジンが

    12.1.2 upであればどこでも利用可能 - オンプレミス: - Db2ソフトウェア - Db2コンテナ - フルマネージド・サービス: - Db2 SaaS (OLTP向け) - Db2 Warehouse SaaS(Warehouse向け) など • 2つの利用方法 - LangChainから使う - SQLで使う 今回はこちら
  3. 3 Db2 12.1.2 ハイライト - ベクトルサポート [参考]アナウンスメントブログ IBM Db2 12.1.2によるAIとクラウド・データ・ジャーニーのエンパワーメント

    Empowering your AI and cloud data journey with IBM Db2 12.1.2 1.ベクターデータストア:AI対応データ管理 Db2 12.1.2 vectorized dataでは、AI アプリケーションのゲームチェンジャーであるベクトル化データの 組み込みサポートが導入されました。新しいベクトルデータタイプを使用すると、従来のスカラーデー タと一緒にベクトルデータを保存および管理できるため、高速で効率的な類似検索が可能になります。 これにより、信頼できるDb2環境内で、Retrieval Augmented Generation(RAG)やレコメンデーション システムなどの高度なAIアプリケーションを簡単に処理できるようになります。 2.類似検索機能 ベクトル距離メトリックを備えた最適化されたSQLクエリは、構造化データと非構造化データのシーム レスな統合を促進し、類似検索を実行する機能を強化します。ユーザーは、使い慣れたSQL構文と組み 込み関数を使用してクエリを構築して、ベクトルデータを簡単に組み込むことができます。さらに、類 似検索により、結果セットを正確な一致を超えて拡張し、コンテキストに関連するデータポイントから 情報のロックを解除できます。構造化データと非構造化データのシームレスな統合により、より豊かな 洞察が得られ、最終的にはAIアプリケーションを使用して意思決定と生産性が向上します。 … (機械翻訳)
  4. 4 Db2ベクトルサポートとLangChainとの統合 • LangChainとは • LLMを使ったアプリケーション開発のための、オープンソースのフレームワーク • LangChainのDb2統合 • Db2のベクトル機能を他のベクトルDB(例:Milvus)と同様に利用できる

    • Db2 LangChain Connectorにより、Db2をLangChainワークフロー内のベクトルストアとして使用できる - LangChainのDb2統合(langchain-db2)は、IBMの関数型データベースDb2 12.1.2以降との連携において、ベク トルストアとベクトル検索機能を提供 - インデックス作成と近似近傍探索(Approximate Nearest Neighbors search)によるパフォーマンス最適化は近 日中に追加予定 • 参考資料 • アナウンスメントブログ Announcing the Db2 LangChain Connector: An enterprise Vector Storage for Python AI workflows • サンプルnotebook IBM Db2 Vector Store and Vector Search • LangChain document IBM Db2 Vector Store and Vector Search • LangChain API Reference langchain-db2
  5. 5 ベクトル・データベースの復習をするには こちらをご覧ください IBM Database Dojo 2025 2025/04/18(金) watsonx.data上のベクトル・データ ベース

    Milvusを見てみよう - RAGとは? - ベクトル・データとは? - ベクトル・データベースとは?
  6. 6 生成AIの「RAG」で注目される「ベクトル・データベース」 ユーザー 質問文 検索 プロンプト(*) 生成AIモデル (LLM) 生成された回答 上位の検索結果

    質問文を元に検索 企業独自の情報 正確な最新情報 指示文 質問文 検索結果 RAG (Retrieval Augmented Generation) 企業独自の情報や正確な最新情報から、生成AIモデル(LLM)に回答を生成させる仕組みです。 生成AIモデルが事前に学習している情報から回答を生成するのではなく、まず回答を生成する ために必要な情報を検索し、その情報を生成AIモデルに入力して回答を生成させます。 キーワード検索ではなく ベクトル・データで類似検索 をします ベクトル・データを類似検索できる ベクトルDBを使います
  7. 7 RAGのために必要なもの#1: ベクトル・データ ベクトル 空間で表現 ベクトル化: 画像や文書の特徴がコンパクトに簡単 にわかるようにデータを「ベクトル」 と呼ばれる数値の配列に変換すること このベクトル化したデータが

    ベクトル・データ 特徴が近いものは ベクトル空間での距離が近い =似ている 類似度が高い ベクトルで比較し類似度が高いものを 検索するのが類似検索 犬: [-0.0743495, 0.0077015962, -0.0379965,・・・・] 猫: [-0.077430636, 0.0015722633, -0.02080709,・・・] ペット: [-0.03074925, 0.075403616, -0.0035724053, ・・] 大根: [-0.009054352, -0.0068704253, -0.04312597, ・・・] 「ペット」との 類似度* 犬 0.8260 猫 0.8316 大根 0.5631 *コサイン類似度: 1に近いほど類似度 が高い 犬 猫 ペット 大根 (イメージ図です) θ θ’ θ’’
  8. 9 データのベクトル化・挿入の流れ • 画像や動画、音声、テキストなどのデータは、「Embedding Model」によって、 ベクトル化されます。 • 特定の特性や関係性をn次元で表現することで、コンパクトにデータ処理を行うこ とができます。 Embeddings

    Model [0.02, 0.01, ・・・] [0.01, 0.04, ・・・] [0.06, 0.05, ・・・] [0.12, 0.49, ・・・] [0.01, 0.94, ・・・] [0.32, 0.40, ・・・] ベクトル ・データ を ベクトル DBへ挿入 データを ベクトル化 画像データや PDF, json,text など ベクトルDB ベクトル・インデックス 属性フィルタリング ・・・ watsonx.data Milvus (ベクトルDB) watsonx.ai granite-embedding-278m-multilingual
  9. 10 (参考) watsonx.data Milvusとwastonx.ai 基盤モデルでのRAG実装 ユーザー 質問文 類似検索 プロンプト 基盤モデル

    watsonx.ai 生成された回答 上位の検索結果 質問文を元に検索 指示文 質問文 検索結果 watsonx.data Milvus (ベクトルDB) 企業独自の情報 正確な最新情報 お客様個別データ PDF, json,text などを 事前にベクトルDBに 入れておく ベクトル化 (embedding) ベクトル化 (embedding) watsonx.dataのMilvus • 生成AIの回答精度向上 • 自社内のデータを活用 2024 TechXchangeでは、 TechXchange概要Excelを、 ベクトル化してベクトル DB Milvusに入れ、類似検 索をしました
  10. 11 (参考) watsonx.data Milvusとwastonx.ai 基盤モデルでのRAG実装 ユーザー 質問文 類似検索 プロンプト 基盤モデル

    watsonx.ai 生成された回答 上位の検索結果 質問文を元に検索 指示文 質問文 検索結果 Db2 企業独自の情報 正確な最新情報 お客様個別データ PDF, json,text などを 事前にベクトルDBに 入れておく ベクトル化 (embedding) 今回は、MilvusをDb2に置き 換えて、ベクトルDBとして同 じことができることを見てみ ます! ベクトル化 (embedding) Db2・ベクトルサポート • 生成AIの回答精度向上 • 自社内のデータを活用
  11. 13 ※ご予約いただく際にお手数ですが「本イベントをご案内したIBM社員名」欄の 「IBM社員名(姓)」:平野真弓 「IBM社員名(名)」:西戸京子 の名前を記してください。 「IBM社員 Eメールアドレス」の記入は不要です。 ※社員はお客様申込サイトから登録しないでください。 『IBM TechXchange

    Summit Japan 2025 』は IBMテクノロジーの最新情報を1日でお届けするイ ベントです。2025年は 12月3日(水)東京国際 フォーラムで開催いたします。 最新技術を学べる100を超えるセッションをはじめ、 IBMテクノロジーをご体感いただけるデモ、ハン ズオン、展示に加えて、技術者同志の交流ができ るハッピーアワーなど、学び合い繋がる場です。 2024年は、 約1,000人の技術者の皆様にご来場い ただきました。今年は去年の倍100以上のセッショ ンと30以上の展示を用意しお客様・パートナー様 をお迎えします。 Website https://ibm.biz/techxchange 2025 2025年8月25日申し込み開始