Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Bedrock Knowledge Basesチャンキング解説!
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
野口碧生
February 01, 2026
Technology
0
370
Amazon Bedrock Knowledge Basesチャンキング解説!
野口碧生
February 01, 2026
Tweet
Share
Other Decks in Technology
See All in Technology
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
44k
ソフトウェアアーキテクトのための意思決定術: Create Decision Readiness—The Real Skill Behind Architectural Decision
snoozer05
PRO
27
8.3k
Databricksアシスタントが自分で考えて動く時代に! エージェントモード体験もくもく会
taka_aki
0
290
What's new in Go 1.26?
ciarana
2
280
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
4
22k
Data Hubグループ 紹介資料
sansan33
PRO
0
2.8k
Agentic Codingの実践とチームで導入するための工夫
lycorptech_jp
PRO
0
380
LINE Messengerの次世代ストレージ選定
lycorptech_jp
PRO
17
7k
競争優位を生み出す戦略的内製開発の実践技法
masuda220
PRO
2
530
AWS CDK の目玉新機能「Mixins」とは / cdk-mixins
gotok365
2
320
Bill One 開発エンジニア 紹介資料
sansan33
PRO
5
18k
脱・コピペ!自分で調べて書くK8sマニフェスト
devops_vtj
0
110
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Bash Introduction
62gerente
615
210k
Paper Plane
katiecoart
PRO
0
47k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
68
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
170
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
860
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
460
SEO for Brand Visibility & Recognition
aleyda
0
4.3k
Skip the Path - Find Your Career Trail
mkilby
1
72
The Invisible Side of Design
smashingmag
302
51k
Transcript
Amazon Bedrock Knowledge Basesチャンキング解説! 標準戦略の使い分けとLambdaカスタムの境界線 発表者: 野口 碧生
豊洲会(1月) 自己紹介 2026/1/22 • AWS歴: 2年 • 好きなAWSサービス: Amazon Bedrock、
CDK • 最近の関心事: 野口 碧生 2025 Japan All Certifications Engineer • RAGの検索精度改善 • Advanced RAGの構築 1
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 2
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 3
豊洲会(1月) RAGの全体像とチャンキングの位置付け 2026/1/22 Documents Chunking Embedding Vector DB Retrieval LLM
(Generation) チャンキングは 「検索の質」 を決定づける最上流工程 不適切なチャンク = Garbage In, Garbage Out 4
豊洲会(1月) チャンキングが影響を与える4つの要素 2026/1/22 コスト(Cost) トークン数への影響 品質/精度(Quality) 文脈の維持 vs ノイズ レイテンシ(Latency)
検索・生成速度 UX 回答の的確さ Trade-Offs 5
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 6
豊洲会(1月) Amazon Bedrock Knowledge Bases 2026/1/22 基盤モデルと自社データソースを組み合わせた RAG(検索拡張生成)をフルマネージドに実現 https://pages.awscloud.com/rs/112-TZM-766/images/AWS-Black-Belt_2024_Amazon-Bedrock-Knowledge-Bases_0920_v1.pdf 7
豊洲会(1月) 戦略①デフォルト & ②固定サイズ(Fixed-size) 2026/1/22 ①デフォルト(約300トークン/文境界) ②固定サイズ(Fixed-size) 固定サイズの特徴:計算コスト◎ / 挙動予測◎
/ 文脈分断リスク△ 8
豊洲会(1月) 戦略③階層的チャンキング(Hierarchical) 2026/1/22 Parent Chunk(Large) Child Chunks (Small) Child Chunks
(Small) Child Chunks (Small) Child Chunks (Small) Child Chunks (Small) LLM 検索は 「子」 で行い、LLMには 「親」 を渡すことで文脈を維持 9
豊洲会(1月) 戦略④セマンティック & ⑤チャンキングなし 2026/1/22 ④セマンティック(意味の類似度で分割) ⑤チャンキングなし(1ファイル=1チャンク) 高精度だが推論コスト増 前処理済みデータ/FAQ向け 10
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 11
豊洲会(1月) Bedrock KB チャンキング戦略比較マトリクス 2026/1/22 戦略 コスト 精度 複雑さ 推奨ユースケース
デフォルト ◦ ◦ 低 汎用的なスタート地点 固定サイズ ◎ △ 低 一般文書 / PoC / 速度優先 階層的 ◦ ◎ 中 文脈が必要な文書 セマンティック △ ◎ 中 複雑な論文 / 契約書 なし ◎ - 低 加工済みデータ / FAQ 12
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 13
豊洲会(1月) カスタムチャンキング(Lambda関数) 2026/1/22 Source S3 ・標準戦略で対応できない特殊要件向け ・任意のロジック(正規表現、外部API等)を実装可能 Bedrock Knowledge Bases
Lambda (Custom Logic) Vector Database 14
豊洲会(1月) カスタムチャンキングの活用ユースケース 2026/1/22 コード ( ) 特殊フォーマット (特定 のみ )
( ルール) タデータ付与 (ファイル ) Lambda 15
豊洲会(1月) どの戦略を選ぶべきか? 2026/1/22 Start 独自の前処理済み? No chunking 特殊フォーマット (Code /
Markdown)? コスト・速度最優先? Custom (Lambda) Fixed-size 複雑な文脈理解 必要? Hierarchical / Semantic Default ★Recommended Starting Point Yes Yes Yes Yes No No No No 16
豊洲会(1月) まとめ 2026/1/22 チャンキングは RAG の 「検索精度」 と 「コスト」 を左右する
Bedrock KB は5つの戦略を提供(デフォルト、固定、階層、意味的、なし) カスタムチャンキングにより、特殊要件にも対応可能 まずは デフォルト でベースラインを作り、評価(Evaluation)しながら 最適化する 17