Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20240615_LT_RAG機能について_.pdf
Search
木村直紀
June 15, 2024
0
86
20240615_LT_RAG機能について_.pdf
木村直紀
June 15, 2024
Tweet
Share
More Decks by 木村直紀
See All by 木村直紀
JAWS FESTA 2025でリリースしたほぼリアルタイム文字起こし/翻訳機能の構成について
naoki8408
1
85
CodeCatalystでCDKのワークフローを簡単に作ろう!
naoki8408
0
7
20240908_共に歩む_Terraformと.pdf
naoki8408
0
6
Featured
See All Featured
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
320
Scaling GitHub
holman
464
140k
First, design no harm
axbom
PRO
2
1.1k
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
76
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
Un-Boring Meetings
codingconduct
0
220
Code Review Best Practice
trishagee
74
20k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.5k
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
YesSQL, Process and Tooling at Scale
rocio
174
15k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.5k
Transcript
AWSでRAG機能の開発? Amazon Bedrock for knowledgebaseを使ったRAG開発について
名前:木村 直紀 趣味:ランニング 筋トレ お酒 業務:AWS構築・保守運用 資格:AWS資格12冠 エンジニア歴:3年目 所属:株式会社ベンジャミン 好きなAWSサービス:AWSサポート
re:Inventって ご存知でしょうか?
re:Inventとは 毎年11月末にラスベガスで開催される AWS最大のカンファレンスイベントです。 →AWSの最新のアップデートが発表が行われます AWS CEOアダム・セリプスキー
昨年はAI元年
数多くのAIサービスが発表されました
今日はその発表の中にあった RAG機能について発表させていただきます
RAG機能とは? RAG (Retrieval-Augmented Generation (検索拡張生成)) は、 大規模言語モデル(LLM)によるテキスト生成に、 外部情報の検索を組み合わせることで、回答精度を向上させる技術のこと。 一般的でない情報や、最新の情報についてAIに質問すると、 AIは嘘をつく、ハルシネーションという現状が起こります。
これを特定のデータストアから情報を持ってくるようにすることで嘘を言わなくするような機能
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 そんな情報知らない ので、適当に答えよ 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 そんな情報知らない ので、適当に答えよ 今日の天気は? 快晴だよ
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は? 台風が来るよ
嘘をほぼつかないChatGPT
すごい機能だ!
どうせお高いんでしょ?
残念ながらお高いです…
下記の構成で約月10万ほど…
ただ今回これを で作る構成を考えました!
やり方は簡単
DBをPineconeに変えるだけ
機能面の違いについて OpenSearch Serverless Pinecone コスト 約10万円/月 無料枠あり (無料枠だと1 indexのみ) 性能
ハイブリッド検索 (ベクトル検索+全文検索) ベクトル検索
https://ai-demo.bjm-tech.com/ 実際に作ったデモアプリを見てもらおうと思います 一般非公開なので画像だけ 貼らせていただきます
Amazon BedrockのKnowledge Baseを Pinecone無料枠で構築してみた 今回説明させていただいたRAGの作り方については下記URLよりご確認ください
6/20-21(来週 木、金)のAWS Summitにもブース出しますので、来られる方はぜひ!