Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ビッグデータにおける、RAGデザインパターン詳解

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.

 ビッグデータにおける、RAGデザインパターン詳解

ビッグデータにおける、RAGデザインパターン詳解

Avatar for 大堀遼介

大堀遼介

June 26, 2024
Tweet

More Decks by 大堀遼介

Other Decks in Programming

Transcript

  1. 自己紹介 • 大堀 遼介(36) • Webアプリエンジニア/データサイエンティスト • 理工学部情報理工学科卒 • 経歴概要

    • 経歴紹介 • バックエンド中心の開発( KADOKAWA ) • エンタープライズ向けシステム統合コンサルティング • データパイプライン基盤(TOYOTA, HONDA, ベルフェイス) • コンシューマ向けデータプロバイダー(MaaS関連企業) • 小売・メーカー向け、AIアプリケーション開発(某大手宅配) • データエンジニア、データサイエンティスト(ABEJA, GRID, DATAFLUCT ...etc) • 株式会社ulusage CEO http://PlagIn-AI.com
  2. 今回の発表のスコープ • 話すこと ◦ あくまでRAG関連 ◦ スケーラビリティなベクトル検索エンジン構築手法 ◦ デモコード ◦

    一部エージェント ▪ マルチエージェントなどは次回あれば • 話さないこと ◦ プロンプトエンジニアリング ◦ データパイプライン ◦ LLMOpsの詳細 ▪ 評価までは話します。
  3. 一般的なRAGプロセス概要 ※ ベクターDBへ「埋め込み」と「検索」イメージ チャンク LLM インデックス 検索 ベクトルDB xxxxxx xxxxxx

    xxxxxx xxxxxx チャンク & ベクトル埋め込み ドキュメント 0.1,0.3, -0.1.. 0.4,0.2, 0.6.. 検索 埋め込み
  4. データの、粒度を決める。 • 特徴の分類を実施する。 • 時系列単位 • コーパス単位 • トピック単位 •

    画像の特徴単位 STEP1: データの粒度を決めよう。 特徴の分類 (親インデックス) 特徴のサブ分類 (子インデックス) チャンクの粒度 (検索対象) デー タ セッ ト 分類 ⅰ 分類 ⅱ 分類 ⅲ サブ 分類 ⅰ サブ 分類 ⅱ サブ 分類 ⅱ 加 工 ロー ド イン デッ クス 作成 スト ア 非同 期 クエ リ 評 価
  5. 子インデックスを登録しよう。 マッピングが完了したので、カテゴリごとの インデックスを作成します。 加 工 ロー ド イン デッ クス

    作成 スト ア 非同 期 クエ リ 評 価 インデックスを作成したら、インデックスへ データのロードを実施します。
  6. テストクエリを評価しよう。 検索結果を以下の指標を使い、評価しましし ょう。 検索評価指標は、多様にありますが、標準検 索の場合には以下の指標を利用するといいで しょう。 加 工 ロー ド

    イン デッ クス 作成 スト ア 非同 期 クエ リ 評 価 指標 説明 結果 MRR (平均逆順位) 一連のクエリに対する結果の逆順位の平均。値が1.0の場 合、完全な順位を示します。 1.0 Recall@5 上位5件の結果に含まれる関連項目の割合。値が1の場合、 関連する全ての項目が上位5件に含まれることを示しま す。 1
  7. 検索拡張生成しよう。 LangChainのAgentとToolsを定義し ますAgentは、ユーザーの指示を 達成するために「思考→行動→ 観察」を行うロボットのような 機能です。入力テキストの内容 に応じて、適切なToolを選択しま す。 Toolには、nameとdescriptionを指 定します。これにより、Agentは

    どのToolを使うべきかを判断しま す。指定は英語で行う方が誤作 動が少なく、LLMの精度が上がれ ば改善されるかもしれません。 加 工 ロー ド イン デッ クス 作成 スト ア 非同 期 クエ リ 評 価