Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ビッグデータにおける、RAGデザインパターン詳解

 ビッグデータにおける、RAGデザインパターン詳解

ビッグデータにおける、RAGデザインパターン詳解

大堀遼介

June 26, 2024
Tweet

More Decks by 大堀遼介

Other Decks in Programming

Transcript

  1. 自己紹介 • 大堀 遼介(36) • Webアプリエンジニア/データサイエンティスト • 理工学部情報理工学科卒 • 経歴概要

    • 経歴紹介 • バックエンド中心の開発( KADOKAWA ) • エンタープライズ向けシステム統合コンサルティング • データパイプライン基盤(TOYOTA, HONDA, ベルフェイス) • コンシューマ向けデータプロバイダー(MaaS関連企業) • 小売・メーカー向け、AIアプリケーション開発(某大手宅配) • データエンジニア、データサイエンティスト(ABEJA, GRID, DATAFLUCT ...etc) • 株式会社ulusage CEO http://PlagIn-AI.com
  2. 今回の発表のスコープ • 話すこと ◦ あくまでRAG関連 ◦ スケーラビリティなベクトル検索エンジン構築手法 ◦ デモコード ◦

    一部エージェント ▪ マルチエージェントなどは次回あれば • 話さないこと ◦ プロンプトエンジニアリング ◦ データパイプライン ◦ LLMOpsの詳細 ▪ 評価までは話します。
  3. 一般的なRAGプロセス概要 ※ ベクターDBへ「埋め込み」と「検索」イメージ チャンク LLM インデックス 検索 ベクトルDB xxxxxx xxxxxx

    xxxxxx xxxxxx チャンク & ベクトル埋め込み ドキュメント 0.1,0.3, -0.1.. 0.4,0.2, 0.6.. 検索 埋め込み
  4. データの、粒度を決める。 • 特徴の分類を実施する。 • 時系列単位 • コーパス単位 • トピック単位 •

    画像の特徴単位 STEP1: データの粒度を決めよう。 特徴の分類 (親インデックス) 特徴のサブ分類 (子インデックス) チャンクの粒度 (検索対象) デー タ セッ ト 分類 ⅰ 分類 ⅱ 分類 ⅲ サブ 分類 ⅰ サブ 分類 ⅱ サブ 分類 ⅱ 加 工 ロー ド イン デッ クス 作成 スト ア 非同 期 クエ リ 評 価
  5. 子インデックスを登録しよう。 マッピングが完了したので、カテゴリごとの インデックスを作成します。 加 工 ロー ド イン デッ クス

    作成 スト ア 非同 期 クエ リ 評 価 インデックスを作成したら、インデックスへ データのロードを実施します。
  6. テストクエリを評価しよう。 検索結果を以下の指標を使い、評価しましし ょう。 検索評価指標は、多様にありますが、標準検 索の場合には以下の指標を利用するといいで しょう。 加 工 ロー ド

    イン デッ クス 作成 スト ア 非同 期 クエ リ 評 価 指標 説明 結果 MRR (平均逆順位) 一連のクエリに対する結果の逆順位の平均。値が1.0の場 合、完全な順位を示します。 1.0 Recall@5 上位5件の結果に含まれる関連項目の割合。値が1の場合、 関連する全ての項目が上位5件に含まれることを示しま す。 1
  7. 検索拡張生成しよう。 LangChainのAgentとToolsを定義し ますAgentは、ユーザーの指示を 達成するために「思考→行動→ 観察」を行うロボットのような 機能です。入力テキストの内容 に応じて、適切なToolを選択しま す。 Toolには、nameとdescriptionを指 定します。これにより、Agentは

    どのToolを使うべきかを判断しま す。指定は英語で行う方が誤作 動が少なく、LLMの精度が上がれ ば改善されるかもしれません。 加 工 ロー ド イン デッ クス 作成 スト ア 非同 期 クエ リ 評 価