Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
今日からRAGを 始めることを考える
Search
shibuiwilliam
May 22, 2024
Technology
3
1.7k
今日からRAGを 始めることを考える
https://mlops.connpass.com/event/315387/
shibuiwilliam
May 22, 2024
Tweet
Share
More Decks by shibuiwilliam
See All by shibuiwilliam
AI人生苦節10年で会得したAIがやること_人間がやること.pdf
shibuiwilliam
1
280
LayerXのApplied R&D
shibuiwilliam
2
30
LLM時代の検索
shibuiwilliam
3
880
生成AIを作るエンジニアリングと使うエンジニアリング
shibuiwilliam
2
87
AI Agentのキャッシュ、再利用、Ops
shibuiwilliam
2
110
生成AIのためのデータ収集とデータエンジニアリング
shibuiwilliam
5
630
LLMで推論するライブラリを整理する
shibuiwilliam
6
1.7k
生成AIの研究開発を事業につなげる データ、仕組み、コミュニケーション
shibuiwilliam
2
120
デプロイして本番システムで使うことから考えるAI
shibuiwilliam
3
760
Other Decks in Technology
See All in Technology
金融サービスにおける高速な価値提供とAIの役割 #BetAIDay
layerx
PRO
1
830
Infrastructure as Prompt実装記 〜Bedrock AgentCoreで作る自然言語インフラエージェント〜
yusukeshimizu
1
120
【新卒研修資料】数理最適化 / Mathematical Optimization
brainpadpr
27
13k
Eval-Centric AI: Agent 開発におけるベストプラクティスの探求
asei
0
120
Lambda management with ecspresso and Terraform
ijin
2
160
僕たちが「開発しやすさ」を求め 模索し続けたアーキテクチャ #アーキテクチャ勉強会_findy
bengo4com
0
2.4k
UDDのススメ - 拡張版 -
maguroalternative
1
550
React Server ComponentsでAPI不要の開発体験
polidog
PRO
0
250
「Roblox」の開発環境とその効率化 ~DAU9700万人超の巨大プラットフォームの開発 事始め~
keitatanji
0
120
「AIと一緒にやる」が当たり前になるまでの奮闘記
kakehashi
PRO
3
150
生成AI導入の効果を最大化する データ活用戦略
ham0215
0
160
Amazon S3 Vectorsは大規模ベクトル検索を低コスト化するサーバーレスなベクトルデータベースだ #jawsugsaga / S3 Vectors As A Serverless Vector Database
quiver
1
530
Featured
See All Featured
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.5k
How to Think Like a Performance Engineer
csswizardry
25
1.8k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
8
760
We Have a Design System, Now What?
morganepeng
53
7.7k
Building Adaptive Systems
keathley
43
2.7k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
Done Done
chrislema
185
16k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
47
9.6k
Rebuilding a faster, lazier Slack
samanthasiow
83
9.1k
Transcript
今日からRAGを 始めることを考える 2024/05/22
自己紹介 shibui yusuke • 文学修士→いろいろ → Stability AI Japan •
主にデータエンジニア • もともとクラウド基盤の開発、運用 • ここ7年くらいMLOpsとバックエンドとインフラと データ関連で仕事 • Github: @shibuiwilliam • FB: yusuke.shibui • 最近の趣味:ルービックキューブ cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知 2 • 本日の資料:
• 発売中! • https://www.amazon.co.jp/dp/4798173401/ • 発売中! • https://www.amazon.co.jp/dp/4798169447/
技術評論社Software & Designで MLOpsについて連載しました! • 2023年8月号 MLOpsの概要 • 2023年9月号 MLOpsのためのスキルセットとチーム構成
• 2023年10月号 方針策定とMLOpsのためのツール • 2023年11月号 MLOpsのための技術選定 • 2023年12月号 LLMのためのDevOps • 2024年1月号 MLOpsと評価 • 2024年2月号 推論システム(予定) • 2024年3月号 機械学習システムの引き継ぎ • 2024年4月号 LLMのデータエンジニアリング • 2024年5月号 機械学習の使い途と未来 MLOpsについてあまり他では取り上げられないテーマを 中心に記事を書きました!
RAGとは
RAGの流れ 検索 統合 生成 UI 今日の天 気を教えて 天気予報 を検索 集めた情
報を整理 文章生成 今日は晴れる でしょう🌞
実際には大体こんな感じ 検索 統合 生成 社内文書 やDB インター ネット LLM 検索ワードを
生成 情報を整理 文章生成 UI
どこまで自作するか? 検索 統合 生成 社内文書 やDB インター ネット LLM 検索ワードを
生成 情報を整理 文章生成 要自作 ロジックは 要自作 自作は 超大変 自作 不可能 検索Indexは要自作 検索基盤はOSS等を 使うことが多い プロンプトは 要自作 ワークフローの インテグレーションは??? UI ツール 次第
そもそもなにが目的? RAG不要 RAG必要 要検討 検索 コーディン グ補助 社内 情報 情報
整理 文章 要約 自動 応答 分析 最新の 情報で LLM RAGでは解決できなさそうなこと: 営業活動、社内調整、プレゼン、出張、 自分の意見を言う、家を買う、受験、 ボランティア、就職活動、世界平和 LLMに 相談 翻訳
簡単な課題を便利なツールで始めるのが良さそう • 簡単 ◦ Dify.ai • コーディングが必要 ◦ Langchain ◦
LlamaIndex • クラウドの知見が必要 ◦ AWS ◦ Azure ◦ GCP • LLMから自作 • そもそもRAGを使わない ◦ OpenAI ◦ Gemini ◦ Claude 簡単 拡張性
RAG LT大会を お楽しみください!