Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
今日からRAGを 始めることを考える
Search
shibuiwilliam
May 22, 2024
Technology
3
1.7k
今日からRAGを 始めることを考える
https://mlops.connpass.com/event/315387/
shibuiwilliam
May 22, 2024
Tweet
Share
More Decks by shibuiwilliam
See All by shibuiwilliam
生成AIシステムとAIエージェントに関する性能や安全性の評価
shibuiwilliam
2
320
AIエージェントによるエンタープライズ向けスライド検索!
shibuiwilliam
4
890
実践マルチモーダル検索!
shibuiwilliam
3
740
生成AI時代のデータ基盤
shibuiwilliam
7
4.9k
LLM時代の検索とコンテキストエンジニアリング
shibuiwilliam
3
1.7k
AI人生苦節10年で会得したAIがやること_人間がやること.pdf
shibuiwilliam
1
400
LayerXのApplied R&D
shibuiwilliam
2
61
LLM時代の検索
shibuiwilliam
3
1.2k
生成AIを作るエンジニアリングと使うエンジニアリング
shibuiwilliam
2
140
Other Decks in Technology
See All in Technology
“決まらない”NSM設計への処方箋 〜ビットキーにおける現実的な指標デザイン事例〜 / A Prescription for "Stuck" NSM Design: Bitkey’s Practical Case Study
bitkey
PRO
1
340
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
980
GitLab Duo Agent Platformで実現する“AI駆動・継続的サービス開発”と最新情報のアップデート
jeffi7
0
160
安いGPUレンタルサービスについて
aratako
1
2k
日本Rubyの会の構造と実行とあと何か / hokurikurk01
takahashim
3
480
Noを伝える技術2025: 爆速合意形成のためのNICOフレームワーク速習 #pmconf2025
aki_iinuma
2
1.1k
Oracle Cloud Infrastructure:2025年11月度サービス・アップデート
oracle4engineer
PRO
1
120
その設計、 本当に価値を生んでますか?
shimomura
3
180
たかが特別な時間の終わり / It's Only the End of Special Time
watany
2
600
バグハンター視点によるサプライチェーンの脆弱性
scgajge12
2
460
プラットフォームエンジニアリングとは何であり、なぜプラットフォームエンジニアリングなのか
doublemarket
1
550
モバイルゲーム開発におけるエージェント技術活用への試行錯誤 ~開発効率化へのアプローチの紹介と未来に向けた展望~
qualiarts
0
290
Featured
See All Featured
4 Signs Your Business is Dying
shpigford
186
22k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.5k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
Rebuilding a faster, lazier Slack
samanthasiow
84
9.3k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
A designer walks into a library…
pauljervisheath
210
24k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.3k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
196
69k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Transcript
今日からRAGを 始めることを考える 2024/05/22
自己紹介 shibui yusuke • 文学修士→いろいろ → Stability AI Japan •
主にデータエンジニア • もともとクラウド基盤の開発、運用 • ここ7年くらいMLOpsとバックエンドとインフラと データ関連で仕事 • Github: @shibuiwilliam • FB: yusuke.shibui • 最近の趣味:ルービックキューブ cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知 2 • 本日の資料:
• 発売中! • https://www.amazon.co.jp/dp/4798173401/ • 発売中! • https://www.amazon.co.jp/dp/4798169447/
技術評論社Software & Designで MLOpsについて連載しました! • 2023年8月号 MLOpsの概要 • 2023年9月号 MLOpsのためのスキルセットとチーム構成
• 2023年10月号 方針策定とMLOpsのためのツール • 2023年11月号 MLOpsのための技術選定 • 2023年12月号 LLMのためのDevOps • 2024年1月号 MLOpsと評価 • 2024年2月号 推論システム(予定) • 2024年3月号 機械学習システムの引き継ぎ • 2024年4月号 LLMのデータエンジニアリング • 2024年5月号 機械学習の使い途と未来 MLOpsについてあまり他では取り上げられないテーマを 中心に記事を書きました!
RAGとは
RAGの流れ 検索 統合 生成 UI 今日の天 気を教えて 天気予報 を検索 集めた情
報を整理 文章生成 今日は晴れる でしょう🌞
実際には大体こんな感じ 検索 統合 生成 社内文書 やDB インター ネット LLM 検索ワードを
生成 情報を整理 文章生成 UI
どこまで自作するか? 検索 統合 生成 社内文書 やDB インター ネット LLM 検索ワードを
生成 情報を整理 文章生成 要自作 ロジックは 要自作 自作は 超大変 自作 不可能 検索Indexは要自作 検索基盤はOSS等を 使うことが多い プロンプトは 要自作 ワークフローの インテグレーションは??? UI ツール 次第
そもそもなにが目的? RAG不要 RAG必要 要検討 検索 コーディン グ補助 社内 情報 情報
整理 文章 要約 自動 応答 分析 最新の 情報で LLM RAGでは解決できなさそうなこと: 営業活動、社内調整、プレゼン、出張、 自分の意見を言う、家を買う、受験、 ボランティア、就職活動、世界平和 LLMに 相談 翻訳
簡単な課題を便利なツールで始めるのが良さそう • 簡単 ◦ Dify.ai • コーディングが必要 ◦ Langchain ◦
LlamaIndex • クラウドの知見が必要 ◦ AWS ◦ Azure ◦ GCP • LLMから自作 • そもそもRAGを使わない ◦ OpenAI ◦ Gemini ◦ Claude 簡単 拡張性
RAG LT大会を お楽しみください!