Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGの構築は脳死でやれ
Search
Asahi
June 11, 2025
0
150
RAGの構築は脳死でやれ
Asahi
June 11, 2025
Tweet
Share
More Decks by Asahi
See All by Asahi
そろそろCursorに戻ってきてもええんちゃう?
asahiiwm
1
880
AI Agent に社内リソース から検索させたい
asahiiwm
1
1.2k
Cloudflareアップデート予想
asahiiwm
0
110
記事を書いた成功体験
asahiiwm
0
10
CloudflareStack でRAGに入門
asahiiwm
0
250
Cloudflare WorkersにNext.jsをデプロイしてみる
asahiiwm
0
330
Featured
See All Featured
A better future with KSS
kneath
239
18k
A Tale of Four Properties
chriscoyier
162
23k
The Invisible Side of Design
smashingmag
302
51k
Building an army of robots
kneath
306
46k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.8k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
24
1.6k
Embracing the Ebb and Flow
colly
88
4.9k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.3k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
GraphQLとの向き合い方2022年版
quramy
49
14k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.6k
Transcript
RAGの構築は脳死でやれ あさひ
株式会社Gemcook あさひ(@asahiXXXXXXXXX) • 領域 ◦ バックエンド/インフラ • 運営
◦ TSKaigi ◦ Cloudflare Meet-up Tokyo ◦ AIAU • 好きなモノ ◦ Cloudflare ◦ Hono ◦ Devin ◦ Cursor, Windsurf 自己紹介
宣伝
• 会社が拡大期!! ◦ 一緒に働ける人を募集しています! ▪ フロントエンド ▪ バックエンド / インフラ
• お仕事の依頼もお待ちしております! ◦ 開発力不足でしたらお声がけください。
AutoRAG
• RAG構築の面倒なところをCloudflareで巻いてくれているも の。RAGに必要なCloudflare Stackのラップサービス。 • RAGの構築、RAGへの検索をフルマネージドにしてくれる サービス。 ◦ 厳密には内部でLLM生成する際にベクトル検索が必要 かは判断しているかも……
Cloudflare AutoRAGって?
通常のRAGの簡単なイメージ ユ | ザ | の 質 問 ベ ク
ト ル 検 索 回 答 を ⽣ 成
広義AutoRAGの簡単なイメージ ユ | ザ | の 質 問 ベ ク
ト ル 検 索 回 答 を ⽣ 成 検 索 が 必 要 か 判 断
Cloudflare AutoRAGって?
何が嬉しいの?
• 格段に簡単に構築できる、検索も容易 • 競合他社で似たようなことしようと思うともっと高額 ◦ AWS Bedrock KnowledgeBaseとか • テナント機能でリクエストに対しての出し分けが可能
◦ metadataを使って分類できる ◦ 部署ごとに参照データを分けることを想定 本来のRAGとの比較
設定 回答の生成 実装例
とはいえ…
• そもそも要件的にAutoRAGが求められるか? • エージェンティックなRAGの方が嬉しくない? ◦ tool callingでAgentが解決してくれる方が嬉しい ◦ MCPに組み込むとか? •
日本語への対応は…… とはいえ…
• 日本語への対応は…… ◦ 現状良くない。(あんままともなものはない) ▪ 軽量なモデルしか扱えない制約がある • LLM ◦ ない
• Embedding ◦ 多言語モデル:bge-m3 Workers AIの日本語について
• LLM ◦ shisa-v2-llama3.1-405b ▪ 上記はどう?って意見聞かれたやつ ◦ gemma-3n-E2B ▪ Google
I/Oで発表されたやつ このへんが採用されたら夢あり Workers AIの日本語について
まとめ
• RAGの構築が簡単、使うのも簡単 • AutoRAG自体はいいが用途が難しい • AutoRAGはAgents SDKと絡めて使うのが良さそう まとめ
ついで