Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20240615_LT_RAG機能について_.pdf
Search
木村直紀
June 15, 2024
93
0
Share
20240615_LT_RAG機能について_.pdf
木村直紀
June 15, 2024
More Decks by 木村直紀
See All by 木村直紀
JAWS FESTA 2025でリリースしたほぼリアルタイム文字起こし/翻訳機能の構成について
naoki8408
1
1.2k
CodeCatalystでCDKのワークフローを簡単に作ろう!
naoki8408
0
20
20240908_共に歩む_Terraformと.pdf
naoki8408
0
14
Featured
See All Featured
The SEO identity crisis: Don't let AI make you average
varn
0
440
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
260
Un-Boring Meetings
codingconduct
0
270
GitHub's CSS Performance
jonrohan
1032
470k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
270
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
200
Deep Space Network (abreviated)
tonyrice
0
120
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
230
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
170
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.5k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
480
WENDY [Excerpt]
tessaabrams
10
37k
Transcript
AWSでRAG機能の開発? Amazon Bedrock for knowledgebaseを使ったRAG開発について
名前:木村 直紀 趣味:ランニング 筋トレ お酒 業務:AWS構築・保守運用 資格:AWS資格12冠 エンジニア歴:3年目 所属:株式会社ベンジャミン 好きなAWSサービス:AWSサポート
re:Inventって ご存知でしょうか?
re:Inventとは 毎年11月末にラスベガスで開催される AWS最大のカンファレンスイベントです。 →AWSの最新のアップデートが発表が行われます AWS CEOアダム・セリプスキー
昨年はAI元年
数多くのAIサービスが発表されました
今日はその発表の中にあった RAG機能について発表させていただきます
RAG機能とは? RAG (Retrieval-Augmented Generation (検索拡張生成)) は、 大規模言語モデル(LLM)によるテキスト生成に、 外部情報の検索を組み合わせることで、回答精度を向上させる技術のこと。 一般的でない情報や、最新の情報についてAIに質問すると、 AIは嘘をつく、ハルシネーションという現状が起こります。
これを特定のデータストアから情報を持ってくるようにすることで嘘を言わなくするような機能
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 そんな情報知らない ので、適当に答えよ 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 そんな情報知らない ので、適当に答えよ 今日の天気は? 快晴だよ
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は? 台風が来るよ
嘘をほぼつかないChatGPT
すごい機能だ!
どうせお高いんでしょ?
残念ながらお高いです…
下記の構成で約月10万ほど…
ただ今回これを で作る構成を考えました!
やり方は簡単
DBをPineconeに変えるだけ
機能面の違いについて OpenSearch Serverless Pinecone コスト 約10万円/月 無料枠あり (無料枠だと1 indexのみ) 性能
ハイブリッド検索 (ベクトル検索+全文検索) ベクトル検索
https://ai-demo.bjm-tech.com/ 実際に作ったデモアプリを見てもらおうと思います 一般非公開なので画像だけ 貼らせていただきます
Amazon BedrockのKnowledge Baseを Pinecone無料枠で構築してみた 今回説明させていただいたRAGの作り方については下記URLよりご確認ください
6/20-21(来週 木、金)のAWS Summitにもブース出しますので、来られる方はぜひ!