Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CloudflareStack でRAGに入門
Search
Asahi
December 12, 2024
Programming
270
0
Share
CloudflareStack でRAGに入門
Asahi
December 12, 2024
More Decks by Asahi
See All by Asahi
そろそろCursorに戻ってきてもええんちゃう?
asahiiwm
1
960
RAGの構築は脳死でやれ
asahiiwm
0
170
AI Agent に社内リソース から検索させたい
asahiiwm
1
1.3k
Cloudflareアップデート予想
asahiiwm
0
120
記事を書いた成功体験
asahiiwm
0
13
Cloudflare WorkersにNext.jsをデプロイしてみる
asahiiwm
0
340
Other Decks in Programming
See All in Programming
LM Linkで(非力な!)ノートPCでローカルLLM
seosoft
0
450
Offline should be the norm: building local-first apps with CRDTs & Kotlin Multiplatform
renaudmathieu
0
180
ルールルルルルRubyの中身の予備知識 ── RubyKaigiの前に予習しなイカ?
ydah
0
120
GNU Makeの使い方 / How to use GNU Make
kaityo256
PRO
16
5.6k
UIの境界線をデザインする | React Tokyo #15 メイントーク
sasagar
1
170
条件判定に名前、つけてますか? #phperkaigi #c
77web
2
1k
Redox OS でのネームスペース管理と chroot の実現
isanethen
0
570
PHPで TLSのプロトコルを実装してみる
higaki_program
0
760
PHPのバージョンアップ時にも役立ったAST(2026年版)
matsuo_atsushi
0
300
煩雑なSkills管理をSoC(関心の分離)により解決する――関心を分離し、プロンプトを部品として育てるためのOSSを作った話 / Solving Complex Skills Management Through SoC (Separation of Concerns)
nrslib
4
840
Running Swift without an OS
kishikawakatsumi
0
740
飯MCP
yusukebe
0
490
Featured
See All Featured
Fireside Chat
paigeccino
42
3.9k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
190
Paper Plane (Part 1)
katiecoart
PRO
0
6.5k
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
1
490
Joys of Absence: A Defence of Solitary Play
codingconduct
1
340
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.1k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
95
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.5k
Darren the Foodie - Storyboard
khoart
PRO
3
3.2k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
410
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
430
Transcript
CloudflareStackでRAGに入門 いわみ あさひ
• 自己紹介 • Cloudflare Stackについて • RAGについて • 構成 •
できたもの • 今後やってみたいこと • まとめ アジェンダ
株式会社Gemcook所属: あさひ(@asahiXXXXXXXXX) バックエンドエンジニア TypeScript、Go、AWS、Cloudflare 歴1年くらい 好きなサービス・OSS Workers、Hono、CDKが好き 趣味 配信(見る方)、StreetFighter6、LoL
自己紹介
株式会社Gemcook所属: あさひ(@asahiXXXXXXXXX) バックエンドエンジニア TypeScript、Go、AWS、Cloudflare 歴1年くらい 好きなサービス・OSS Workers、Hono、CDKが好き 趣味 配信(見る方)、StreetFighter6、LoL
自己紹介 Zennで 週刊Cloudflare という記事を 毎週出しています。 Zenn: あさひ@asahi_iwm
Cloudflare Stack
• Cloudflare DeveloperのYoutubeで紹介されていた ◦ The Cloudflare Stack • どこかで説明されてるわけでは ないがCloudflareのサービスを
スタックとして理解 Cloudflare Stackって?
RAG
• RAG(Retrieval Augmented Generation) ◦ 事前情報を与えてそれを踏まえて回答を生成して くれるやつ ◦ 通常のLLMだとそのモデルが学習した時点まで の情報でしか回答を生成してくれない
RAGって何?
今回の構成
• Workers ◦ Hono ◦ Drizzle • Workers AI •
D1 • Vectorize 今回の構成
D1にナレッジを保存する コンテンツをベクトル化 ナレッジ(事前情報)を保存する流れ VectorizeにD1のIDと一緒に保存
ナレッジ(事前情報)を保存する流れ
ナレッジ(事前情報)を保存する流れ
ナレッジ(事前情報)を保存する流れ
回答を生成する流れ 質問をベクトルデータにする 類似するベクトルデータを探してナレッジを探す ナレッジをコンテキストとし AIに回答を生成させる
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
できたもの
• Demo ◦ めっちゃ簡単にやります できたもの
今後やってみたいこと
• AI Gatewayを使って日本語対応 ◦ Workers AIに日本語モデルがない… • Streamingレスポンス対応 • 画面を用意する
• D1以外の採用(KVとかR2) • RAGを活用して何かを作ってみる 今後やってみたいこと
まとめ
• Cloudflare Stackで RAGに入門することができた • 基礎的なRAGの仕組みは理解できた • 日本語対応モデルがないのが残念 まとめ