Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGの構築は脳死でやれ
Search
Asahi
June 11, 2025
0
100
RAGの構築は脳死でやれ
Asahi
June 11, 2025
Tweet
Share
More Decks by Asahi
See All by Asahi
AI Agent に社内リソース から検索させたい
asahiiwm
1
1.1k
Cloudflareアップデート予想
asahiiwm
0
100
記事を書いた成功体験
asahiiwm
0
8
CloudflareStack でRAGに入門
asahiiwm
0
220
Cloudflare WorkersにNext.jsをデプロイしてみる
asahiiwm
0
230
Featured
See All Featured
A designer walks into a library…
pauljervisheath
207
24k
For a Future-Friendly Web
brad_frost
179
9.8k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.8k
RailsConf 2023
tenderlove
30
1.1k
4 Signs Your Business is Dying
shpigford
184
22k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.4k
Gamification - CAS2011
davidbonilla
81
5.3k
YesSQL, Process and Tooling at Scale
rocio
173
14k
The Cost Of JavaScript in 2023
addyosmani
51
8.5k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
20
1.3k
Embracing the Ebb and Flow
colly
86
4.7k
Being A Developer After 40
akosma
90
590k
Transcript
RAGの構築は脳死でやれ あさひ
株式会社Gemcook あさひ(@asahiXXXXXXXXX) • 領域 ◦ バックエンド/インフラ • 運営
◦ TSKaigi ◦ Cloudflare Meet-up Tokyo ◦ AIAU • 好きなモノ ◦ Cloudflare ◦ Hono ◦ Devin ◦ Cursor, Windsurf 自己紹介
宣伝
• 会社が拡大期!! ◦ 一緒に働ける人を募集しています! ▪ フロントエンド ▪ バックエンド / インフラ
• お仕事の依頼もお待ちしております! ◦ 開発力不足でしたらお声がけください。
AutoRAG
• RAG構築の面倒なところをCloudflareで巻いてくれているも の。RAGに必要なCloudflare Stackのラップサービス。 • RAGの構築、RAGへの検索をフルマネージドにしてくれる サービス。 ◦ 厳密には内部でLLM生成する際にベクトル検索が必要 かは判断しているかも……
Cloudflare AutoRAGって?
通常のRAGの簡単なイメージ ユ | ザ | の 質 問 ベ ク
ト ル 検 索 回 答 を ⽣ 成
広義AutoRAGの簡単なイメージ ユ | ザ | の 質 問 ベ ク
ト ル 検 索 回 答 を ⽣ 成 検 索 が 必 要 か 判 断
Cloudflare AutoRAGって?
何が嬉しいの?
• 格段に簡単に構築できる、検索も容易 • 競合他社で似たようなことしようと思うともっと高額 ◦ AWS Bedrock KnowledgeBaseとか • テナント機能でリクエストに対しての出し分けが可能
◦ metadataを使って分類できる ◦ 部署ごとに参照データを分けることを想定 本来のRAGとの比較
設定 回答の生成 実装例
とはいえ…
• そもそも要件的にAutoRAGが求められるか? • エージェンティックなRAGの方が嬉しくない? ◦ tool callingでAgentが解決してくれる方が嬉しい ◦ MCPに組み込むとか? •
日本語への対応は…… とはいえ…
• 日本語への対応は…… ◦ 現状良くない。(あんままともなものはない) ▪ 軽量なモデルしか扱えない制約がある • LLM ◦ ない
• Embedding ◦ 多言語モデル:bge-m3 Workers AIの日本語について
• LLM ◦ shisa-v2-llama3.1-405b ▪ 上記はどう?って意見聞かれたやつ ◦ gemma-3n-E2B ▪ Google
I/Oで発表されたやつ このへんが採用されたら夢あり Workers AIの日本語について
まとめ
• RAGの構築が簡単、使うのも簡単 • AutoRAG自体はいいが用途が難しい • AutoRAGはAgents SDKと絡めて使うのが良さそう まとめ
ついで