Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
社内規程RAGの精度を73.3% → 100%に改善した話
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
oharu121
February 26, 2026
Programming
8.8k
13
Share
社内規程RAGの精度を73.3% → 100%に改善した話
RAGの精度を73%から100%に引き上げた、実録・チャンキング戦略とデータ前処理の工夫
oharu121
February 26, 2026
Other Decks in Programming
See All in Programming
開発とはなにか、Essenceカーネルで見えるもの
ukin0k0
0
210
運用エージェントは "作る" から "育てる" へ - 記憶と自己進化の3層設計パターン / self-evolving-agents-three-layer-agent-design
gawa
11
2.6k
AI駆動開発で崩れていくコードベースを立て直す
kyoko_nr_nr
1
370
ECR拡張スキャンでSBOMを収集して サプライチェーン攻撃の影響調査を 爆速で終わらせてみた
akihisaikeda
2
200
実践ハーネスエンジニアリング:ステアリングループを実例から読み解く / Practical Harness Engineering: Understanding Steering Loops Through Real-World Examples
nrslib
6
6.3k
Make SRE Operations Easier with Azure SRE Agent
kkamegawa
0
390
ユニットテストの先へ:テスト技法で要求・仕様を整理するJava開発実践 / Beyond_Unit_Testing_Practical_Java_Development_Techniques_for_Organizing_Requirements_and_Specifications
shimashima35
0
150
Inside Stream API
skrb
1
160
SkillsをS3 Filesに置く時のあれこれ
watany
4
1.8k
Lemonade + Foundry Toolkit でお手軽アプリ開発
seosoft
1
130
過去のレビュー知見をSkillsで資産化した話
pkshadeck
PRO
1
2.3k
AIエージェントと協働するCLI開発 — BunとOpenClawで学んだこと
yoshikouki
1
210
Featured
See All Featured
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
120
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
The Pragmatic Product Professional
lauravandoore
37
7.3k
How to Talk to Developers About Accessibility
jct
2
210
Making Projects Easy
brettharned
120
6.6k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.8k
First, design no harm
axbom
PRO
2
1.2k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
Side Projects
sachag
455
43k
エンジニアに許された特別な時間の終わり
watany
107
240k
Transcript
社内規程RAGの精度を73.3% → 100%に改善した話 複雑な手法より、まずは「チャンクサイズ」を見直 すべき理由 Yuchen Lin(リン ユウチェン)
自己紹介 & プロジェクト概要 自己紹介 • 名前:リン ユウチェン • 実績:AIハッカソンのファイナリスト10組 •
最近のマイブーム:OpenClaw(旧ClawdBot) プロジェクト概要 • RAGを探索するデモプロジェクト • 目的:チャンキング戦略を検証する • 開発:Next.js + FastAPI + Gemini 2.0 Flash • 課題: 社内規程(通勤手当、休暇など)を対象にした RAG。最初は「正解率 73.3%」という微妙な結果に。
RAGを「Google検索」で例えると? ステップ1:検索 ステップ 2:読解 クエリを送信すると、システムは「 上位K件」の結果を見つける →(Google検索結果1ページ目 のようなもの) そのK件の結果をLLMに渡します →人間がスニペットを読む
ように 検索結果をもとに、ユーザのクエ リに回答する ステップ 3:回答 答えが検索結果の2ページ目にある場合、LLMはそ れを見ることができない。 どんなに「賢い」LLMであっても、読んでいないこと には答えられない。
RAGが失敗する「あるある」 3選
解決への体系的アプローチ:3つの改善軸でボトルネックを特定 精度低下の要因を特定するため、以下の 3つの改善軸 に沿って複数の技術的な戦略を評価しまし た。これにより、最も効果的な打ち手は何かをデータに基づき判断します。 データ (Data) チャンキング (Chunking) 検索
(Retrieval) 生成 (Generation) 1. データ自体の最適化 (Data Preprocessing) 検索対象のドキュメント構造 そのもの を改善できるか。 テスト項目:従業員種別ごと のドキュメ ント分割 2. チャンキングの最適化 (Chunking Strategy) テキストをどのように分割・保持する か。 テスト項目:標準、大きめ、親子チャン ク、HyDE(仮説的質問) 3.検索後処理の導入 (Post-Retrieval) 検索結果をどう絞り込み、順位付けす るか。 テスト項目:クロスエンコーダーによる 再ランク付け
検証結果:データ最適化がほかの手法を凌駕 テスト条件 • 評価クエリ: 15問(例外規定の取得をテスト) • 各戦略で同じクエリセットを実行 • 正解判定: 必須キーワード
の有無で自動判定
チャンキング戦略の比較分析:なぜ「大きなチャンク」が勝ったのか 1. 標準チャンク イメージ Google検索に表示される 1段落だけ を読 んで回答しようとする状態。 イメージ 検索結果リンク(子)
をクリックして、前後 の文脈を含めた「 ページ全体(親) 」を LLMに渡す状態。 イメージ Google検索に表示される 数段落分 を読 んで回答しようとする状態。 2. 大き目チャンク 3. 親子チャンク
さらなる精度向上に向けた高度なアプローチ 1. 「聞き返す」検索 2. マルチインデックス振り分け 3.「意味の切れ目」の自動認識 ユーザーの質問が曖昧なとき、勝手に 検索せずエージェントが 逆質問 する。
規程の種類ごとに DBを分け、クエリにお じてエージェントが 最適な DBを選択する。 文書の構造や意味のまとまりを理解し、 動 的にチャンクサイズを変える。
Zenn 記事をチェック! ご視聴ありがとうご ざいました。 Githubをチェック!