Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
社内RAGの導入で気を付けたポイント
Search
やくも
May 20, 2026
Technology
100
1
Share
社内RAGの導入で気を付けたポイント
クラウド食堂 #8 ~クラウド初心者応援LT会~
https://cloud-shokudo.connpass.com/event/391531/
やくも
May 20, 2026
More Decks by やくも
See All by やくも
おいらのAWSアップデートの追い方〜Slack×AgentCore〜
yakumo
1
110
AgentCore Managed Harness を使ってみよう
yakumo
2
340
AgentCoreがWindowsで動かなかった原因を調べてみた
yakumo
1
91
AgentCoreとLINEを使った飲食店おすすめアプリを作ってみた
yakumo
2
380
StrandsとNeptuneを使ってナレッジグラフを構築する
yakumo
2
560
なんとなくの実装を抜け出す!10分でおさらいするAgentCoreの認証・認可
yakumo
2
490
AWSと生成AIで学ぶ!実行計画の読み解き方とSQLチューニングの実践
yakumo
3
1.4k
AIエージェントを5分で一気におさらい!AIエージェント「構築」元年に備えよう
yakumo
1
190
AI時代のワークフロー設計〜Durable Functions / Step Functions / Strands Agents を添えて〜
yakumo
5
3.8k
Other Decks in Technology
See All in Technology
鹿野さんに聞く!CSSの最新トレンド Ver.2026
tonkotsuboy_com
6
3.4k
アプリブロック機能のつくりかたと、AIとHTMLの不合理な相性の良さについて
kumamotone
1
260
AI 時代の Platform Engineering
recruitengineers
PRO
1
210
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.4k
ボトムアップ限界を越える - 20チームを束る "Drive Map" / Beyond Bottom-Up: A 'Drive Map' for 20 Teams
kaonavi
0
230
パーソルキャリア IT/テクノロジー職向け 会社紹介資料|Company Introduction Deck
techtekt
PRO
0
190
20260516_SecJAWS_Days
takuyay0ne
2
430
ワールドカフェ再び、そしてゴール・ルール・ロール・ツール / World Café Revisited, and the Goals-Rules-Roles-Tools
ks91
PRO
0
170
"スキルファースト"で作る、AIの自走環境
subroh0508
0
510
可視化から活用へ — Mesh化・Segmentation・アライメントの研究動向
gpuunite_official
0
220
データモデリング通り #5オンライン勉強会: AIに『ビジネスの文脈』を教え込むデータモデリング
datayokocho
0
280
「強制アップデート」か「チームの自律」か?エンタープライズが辿り着いたプラットフォームのハイブリッド運用/cloudnative-kaigi-hybrid-platform-operations
mhrtech
0
200
Featured
See All Featured
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Everyday Curiosity
cassininazir
0
210
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
400
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
Deep Space Network (abreviated)
tonyrice
0
140
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
370
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.2k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
360
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
55k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
230
Transcript
社内RAGを導入するまで気を付けたポイント 八雲 慎之助/Shinnosuke Yakumo 2026/5/19 クラウド食堂 #8
クラウド食堂、本日初めてお邪魔します!
八雲 慎之助(やくも しんのすけ) • 所属:株式会社クレスコ / JAWS-UG 新潟支部 • 業務:R&D(AI分野)
• AWS Community Builder – AI Engineering • 2025 Japan AWS Jr.Champions Who am I
アジェンダ •前提 •技術的制約について(話せる範囲で) •現状と今後のアーキテクチャ •技術選定の判断
まず出発点として…(今回はRAGの話だけど..) •チームや組織内に知見はありますか? •使用する技術の制約はありますか? •コスト等の条件は? →個人で検証するのとは違ってチームや組織によっ て条件は様々ありますよね…!
モデル選定 ー OpenAI互換のモデルを使いたい! え!?AWSのナレッジベースなのに OpenAI互換のモデルを使わないとい けないの? →OpenAIはfunction callingを利用 すればツールの選択ができます。
コストの最適化の検討 ー ベクトルストアの選択 • OpenSearchではなく基本的にS3 Vectorsを利用する。 • 9割近いコスト削減が可能 ※シナリオによる
リテラシー、ナレッジの蓄積の課題 • Bedrockに送ると情報全部見られるの? • マルチモーダルなRAGも作りたいなあ • 応答精度があんまし高くないんだよなあ.. • この他にも複数の課題が放置されている
今後(現在)の展望:RAG部分の再利用化
RAG部分の再利用化 hogehoge… この部分を…
RAG部分の再利用化 hogehoge… 切り出す!
RAG部分の再利用化 いろんなアプリから使いたい!
Bedrock AgentCoreの利用 •便利な機能がたくさんあるので飛びつきたくなるが •そもそも現状では組織内にナレッジ不足すぎる •正直RAG単体での実装でAgentCore Gatewayは オーバースペックかな… →メンバーのAgentCoreの知見を先にためていく
まとめ •流行りのAgentCoreもいいけど、慎重に技術選定を 行う •制約は前提として取り組む •RAG単発で終わらせずに、切り出すことで再利用を 見据えたアーキテクチャとする
告知とか
宣伝:JAWS-UG 新潟支部 BuilderCards 体験会 • 日時:2026/6/6(土) 13:30~17:30 • 会場:新潟駅 NINNO
3 A Room • Bulider Cards 体験会