RAG を使わないという選択肢

白金鉱業 Meetup Vol.24 長文回答生成で、RAG を前提にしない設計の話 RAG を使わないという選択肢 1

実務とAIコンペの経験をもとに共有します。本堂貴也 NTT東日本株式会社データサイエンティスト(3年目) 自己紹介好きなこと AIコンペ参加 3D系画像が好きです（動画, MRI画像など）
AI コンペ実績 Kaggle Expert Signate GM 資格統計検定準一級 E資格 AWS 9冠など CERT 業務 SaaS開発社内データ活用施策の推進など WORK 2

実案件をもとに、長文ドキュメントの情報抽出では、RAGが常に最適とは限らない話をします今日お話しすること 01 案件設定と自分の前提知識 10万字級Transcript×複数質問。最初は自然にRAGを想定 4-5p 02 衝突した課題
検索精度・文脈幅・情報点在で、根拠取得が不安定に 6p 03 要件の見直しと非RAG構成の実現要件に立ち返り、Window走査＋質問別集約へ 7-11p 3

長文回答生成で、要件を見る前に RAG を第一候補にしがちではありませんか？長文ドキュメント 10 万字級の文章ナレッジ chunk 01 chunk
02 chunk 03 chunk ... embedding metadata index 検索対象として保存フロントユーザーの質問長文が題材だとつい RAG を選びがちチャンク化検索関連チャンク 4

案件の要件：顧客ヒアリングの会話内容から、要件整理に必要な情報を質問形式で取り出す／バッチ処理でOK／とにかく精度向上で稼働を削減したい実案件においても私の最初の発想は RAG 5 会話内容をナレッジとして、質問をキーとしたRAG構成がよさそうだな困りごとに関してヒアリング 10万字の文字起こし
会話内容に関する複数質問 RAG構成を検討問題設定顧客が一番困っていること ? 手間や属人化がある箇所 ? 導入時に守るべき制約 ? 次に確認すべき宿題 ?

実装してみると、欲しい根拠を安定して取れませんでした… 検索改善を試すうまくいかない理由根拠が安定しない試したことクエリ拡張質問を言い換え、検索クエリを増やす狙い：表現ゆれを吸収する HyDE 仮の回答文を作り、その文で検索する
狙い：質問意図に近い表現で探す親子チャンク小チャンクで検索し、親チャンクも参照する狙い：検索粒度と文脈を両立する文脈理解の壁 1 会話の文字数ひとつの話題が数千字におよび、チャンクサイズに収まらない。 → 局所チャンクだけでは意味を捉えにくい 2 質問に関する情報が点在関連情報が会話内に散らばっていたり、少し前のトピックを引用した会話では、曖昧な主語・目的語の表現になる。 → キーワード一致だけでは拾いにくい結果検索精度は少し上がるが、根拠取得は安定せず… 検索精度の壁にぶつかった検索そのものがボトルネックとして残ってしまった 6

要件に立ち返ると、RAG の強みが刺さる案件ではありませんでした区分観点 RAG の強み今回の案件ユーザー要望速度即時回答が必要な場面に強い
回答時間に余裕があったコスト入力量を強く抑えたい多少の入力コストは許容最終回答の精度検索結果の範囲で十分取りこぼしを減らしたい文章の性質検索の難しさ質問と根拠箇所が対応しやすい（例：章で内容が分かれてる規約資料など）根拠箇所が曖昧・広範囲（例：ヒアリングの会話内容など）必要な文脈幅局所的な根拠で答えられる（例：章で内容が分かれてる規約資料など）会話全体や複数箇所の統合が重要（例：ヒアリングの会話内容など） RAG は、チャットBotで社内規定を検索するような「まとまった情報をリアルタイムに拾う」場面で強い。今回は、会話を対象とするので、より広い文脈理解が重要でした。本当に RAG が必須なのか？ 7

検索自体が、最終的な回答を出力するのに必要な情報を削ってしまうボトルネック工程になってしまう ⇒検索そのものを無くせないか 🤔 8

各質問に対して全文脈を渡し、検索せずに質問別で集約する構成を実装 Windowごとに全質問をLLMへ入力トランスクリプト（10万字）重なりありで 1万字ずつ分割 Window 1 / Window
2 / Window 3 Window 1 1万字程度 Q1 困りごと Q2 現行運用 Q3 導入条件 Q1 月末作業が集中 Q2 Excel転記が多い Q3 情報なし Window 2 1万字程度 Q1 困りごと Q2 現行運用 Q3 導入条件 Q1 確認漏れが発生 Q2 判断が担当者依存 Q3 CRM連携が必要 Window 3 1万字程度 Q1 困りごと Q2 現行運用 Q3 導入条件 Q1 情報なし Q2 履歴が残らない Q3 権限設定が必要質問ごとに集約 → 最終出力 Q1 困りごと W1: 月末集中 W2: 確認漏れ W3: 情報なし Q1 月末集中と確認漏れが主課題 Q2 現行運用 W1: Excel転記 W2: 担当者依存 W3: 履歴なし Q2 転記削減と運用標準化が必要 Q3 導入条件 W1: 情報なし W2: CRM連携 W3: 権限設定 Q3 CRM連携と権限設計が条件考案したソリューションの全体像 9 LLMで情報抽出 LLMで情報抽出 LLMで情報抽出 Qごとに集約 LLMで要約 LLMで要約 LLMで要約

話題が戻る会話でも、前に出た内容を踏まえて読める幅にしたかった会話の流れ A 困りごとの話（数千字） B 運用・制約の話（数千字） A 同じ困りごとに戻る
（数千字）（主語や目的語があいまいになりがち）後に出てくるAを理解するためには、先に出てきたAが前提情報となる。 ⇒両方を一つのWindowに入れてLLMで情報を抽出したい。 1万字 = 1つのトピックに対して網羅的に情報を拾える範囲かつ、ハルシネーションが起こりにくい文字数（この時はClaude Sonnet 4.5を使用）なぜ1万字のWindow分割にしたのか？ 10

要件に合わせて構成を変えたことで、かなり出力の品質と納得感が上がった！要望元からのコメント（RAG構成から切り替えて）かなりいい出力になったと感じます！全文脈を活用検索をなくし、会話全体から根拠を拾えた。取りこぼし低減根拠候補を広く拾え、出力品質が向上。構成を選ぶ判断軸
ユーザーの要望速度 RAG向き即時回答が必要今回バッチでOK コスト RAG向き入力を抑えたい今回コスト許容最終回答の精度 RAG向き検索範囲で十分今回取りこぼし低減対象とする文章の性質検索の難しさ RAG向き根拠が対応しやすい今回根拠が曖昧必要な文脈幅 RAG向き局所根拠で回答今回全体を統合今回考案した手法は遅いしコストがかかる。ただ、トランスクリプトの情報を網羅的に使えるので、出力の品質はかなり高い。 RAG は有力だけど、速度・コスト・検索難易度・文脈幅で、案件に合う構成を選ぶことが大事だと案件を通して学びました。結果とまとめ 11

発表内容やコンペの話など、ぜひ気軽にお声がけいただけると嬉しいです！ X X (Twitter) tatsutaka @Ka2vt0w4rQtN3jA https://x.com/Ka2vt0w4rQtN3jA k Kaggle tatsutaka
kaggle.com/tatsutaka https://www.kaggle.com/tatsutaka ご清聴ありがとうございました！ 12

RAG を使わないという選択肢

RAG を使わないという選択肢

tatsutaka

Other Decks in Technology

Featured

Transcript

白金鉱業 Meetup Vol.24 長文回答生成で、RAG を前提にしない設計の話 RAG を使わないという選択肢 1

実務とAIコンペの経験をもとに共有します。本堂貴也 NTT東日本株式会社データサイエンティスト(3年目) 自己紹介好きなこと AIコンペ参加 3D系画像が好きです（動画, MRI画像など）

実案件をもとに、長文ドキュメントの情報抽出では、RAGが常に最適とは限らない話をします今日お話しすること 01 案件設定と自分の前提知識 10万字級Transcript×複数質問。最初は自然にRAGを想定 4-5p 02 衝突した課題

長文回答生成で、要件を見る前に RAG を第一候補にしがちではありませんか？長文ドキュメント 10 万字級の文章ナレッジ chunk 01 chunk

要件に立ち返ると、RAG の強みが刺さる案件ではありませんでした区分観点 RAG の強み今回の案件ユーザー要望速度即時回答が必要な場面に強い

検索自体が、最終的な回答を出力するのに必要な情報を削ってしまうボトルネック工程になってしまう ⇒検索そのものを無くせないか 🤔 8

各質問に対して全文脈を渡し、検索せずに質問別で集約する構成を実装 Windowごとに全質問をLLMへ入力トランスクリプト（10万字）重なりありで 1万字ずつ分割 Window 1 / Window

話題が戻る会話でも、前に出た内容を踏まえて読める幅にしたかった会話の流れ A 困りごとの話（数千字） B 運用・制約の話（数千字） A 同じ困りごとに戻る

発表内容やコンペの話など、ぜひ気軽にお声がけいただけると嬉しいです！ X X (Twitter) tatsutaka @Ka2vt0w4rQtN3jA https://x.com/Ka2vt0w4rQtN3jA k Kaggle tatsutaka