検索拡張生成（RAG）をAWSで作る方法

©Fusic Co., Ltd. 1 検索拡張⽣成（RAG）をAWSで作る⽅法 2024.4.24 苑⽥朝彰 @sonoda_mj Fusic
Tech Live Vol.19

©Fusic Co., Ltd. 2 苑⽥朝彰 Sonoda Tomotada - X:
sonoda_mj - 2023 AWS Jr.Champions - 2024 Community Builders(ML & GenAI) コメント最近AWS StepFunctionsにハマってる⾃⼰紹介はじめに株式会社Fusic

©Fusic Co., Ltd. 3 CONTENTS ⽬次 1. 検索拡張⽣成（RAG）とは 2. RAGをAWSで作ってみる
3. まとめ

©Fusic Co., Ltd. 4 検索拡張⽣成(RAG)とは 1

©Fusic Co., Ltd. 5 Retrieval Augmented Generation（RAG）⽣成系の⾔語 AI モデルに外部メモリをつけるというコンセプトのことを指す
検索拡張⽣成(RAG)とは Vector Database LLM 質問検索返答検索結果引用：https://github.com/aws-samples/jp-rag-sample

©Fusic Co., Ltd. 6 事前に学習したデータに関しては返答することができる検索拡張⽣成(RAG)とは LLM AWSについて教えて AWSってのはな

©Fusic Co., Ltd. 7 しかし、プライベート情報や新しい情報など、学習していない内容に関しては答えられない検索拡張⽣成(RAG)とは苑⽥について教えて私の知識はxxxx年まででぇ LLM

©Fusic Co., Ltd. 8 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関する回答を⽣成することができる検索拡張⽣成(RAG)とは Vector Database 苑⽥について教えて

©Fusic Co., Ltd. 9 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関する回答を⽣成することができる検索拡張⽣成(RAG)とは Vector Database 苑⽥について教えて

©Fusic Co., Ltd. 10 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関する回答を⽣成することができる検索拡張⽣成(RAG)とは Vector Database 検索結果を返す

©Fusic Co., Ltd. 11 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関する回答を⽣成することができる検索拡張⽣成(RAG)とは Vector Database 苑⽥ってのは…

©Fusic Co., Ltd. 12 Fusicの公開情報から構成されるRAG Fusic-RAG メンバー紹介ニュース開発事例その他

©Fusic Co., Ltd. 13 RAGはどういう処理を⾏っているのか 1. 質問をベクトル化する 2. ベクトル化した質問を元に、Vector DBから似ているベク
トル（上位n個）を探す 3. 検索結果と質問からプロンプトを作成 4. LLMにプロンプトを投げる

©Fusic Co., Ltd. 14 今回の登場⼈物 User Embedding Model Vector DB
LLM 質問をする⼈テキストをベクトルにするモデルベクトル⽤のDB テキストを⽣成するモデル

©Fusic Co., Ltd. 15 Vector DBにデータを⼊れる AWSを業務で使っています。テキストをベクトル化する Vector
DB Embedding Model LLM データソース

©Fusic Co., Ltd. 16 Vector DBにデータを⼊れる [0.1, 0.5, 0,3 …]
Vector DB Embedding Model LLM データソース

©Fusic Co., Ltd. 17 Vector DBにデータを⼊れる ≈≈ { [0.1, 0.5,
0,3 …] metadata: { text: AWSを業務で使っています。 dataSource: sonoda.md } } Vector DB Embedding Model LLM データソース

©Fusic Co., Ltd. 18 1. 質問をベクトル化する苑⽥さんって誰ですか？ Vector DB Embedding
Model LLM

©Fusic Co., Ltd. 19 1. 質問をベクトル化する [0.1, 0.5, 0,3 …]
Vector DB Embedding Model LLM

©Fusic Co., Ltd. 20 2. ベクトル化した質問を元に、Vector DBから似ているベクトルを探す [0.1, 0.5, 0,3
…]に似ているベクトルを探す Vector DB Embedding Model LLM

©Fusic Co., Ltd. 21 2. ベクトル化した質問を元に、Vector DBから似ているベクトルを探す { [0.1, 0.5,
0,3 …] metadata: { text: AWSを業務で使っています。 dataSource: sonoda.md } } 似てるのあったわ Vector DB LLM

©Fusic Co., Ltd. 22 Embedding Model 3. 検索結果と質問からプロンプトを作成あなたはhogehogeです以下の質問に答えてください
# 情報 AWSを業務で使っています。 # 質問苑⽥さんって誰ですか？ Vector DB LLM

©Fusic Co., Ltd. 23 Embedding Model 4. LLMにプロンプトを投げる Vector DB
LLM あなたはhogehogeです以下の質問に答えてください # 情報 AWSを業務で使っています。 # 質問苑⽥さんって誰ですか？

©Fusic Co., Ltd. 24 4. LLMにプロンプトを投げる AWSを業務で使ってます Vector DB Embedding
Model LLM

©Fusic Co., Ltd. 25 会話履歴も⼊れてみる苑田とは誰ですか？ AWSエンジニアです詳細を教えてください詳細とは何でしょうか？苑田とは誰ですか？
AWSエンジニアです詳細を教えてください彼はAWSだけではなく、Rubyも書けるようです。緑のタイツを着ています。会話履歴を使⽤しない場合会話履歴を使⽤した場合

©Fusic Co., Ltd. 26 RAGをAWSで作ってみた 2

©Fusic Co., Ltd. 27 AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon などの⼤⼿ AI 企業が提供する⾼性
能な基盤モデル (FM) を単⼀の API で選択できるフルマネージド型サービス Amazon Bedrockとは

©Fusic Co., Ltd. 28 RAGはどういう処理を⾏っているのか(再掲) 1. 質問をベクトル化する 2. ベクトル化した質問を元に、Vector DBから似ているベク
トル（上位n個）を探す 3. 検索結果と質問からプロンプトを作成 4. LLMにプロンプトを投げる

©Fusic Co., Ltd. 29 RAGはどういう処理を⾏っているのか(再掲) 1. 質問をベクトル化する 2. ベクトル化した質問を元に、Vector DBから似ているベク
トル（上位n個）を探す 3. 検索結果と質問からプロンプトを作成 4. LLMにプロンプトを投げる簡単に作成できる!!

©Fusic Co., Ltd. 30 Amazon Bedrock 内から基盤モデルをデータソースに接続して、検索拡張⽣成 (RAG) を⾏うことができる。 Knowledge
Base for Amazon Bedrock Bedrock LLM Bedrock Embedding Model Vector DB Data Source or or or S3 様々なデータを⼊れる .txt, .md, .html, .doc/docx .csv, .xls/.xlsx, .pdf

©Fusic Co., Ltd. 40 実際の流れ or RAGの処理会話ログの保存 RAGの処理 1.
質問をベクトル化する 2. ベクトル化した質問を元に、 Vector DBから似ているベクトル（上位n個）を探す 3. 検索結果と質問からプロンプトを作成 4. LLMにプロンプトを投げる 5. 回答を受け取る

©Fusic Co., Ltd. 43 まとめ検索拡張⽣成(RAG)は、⾔語AIモデルに外部メモリを付けることで、未学習データにも対応可能にする技術。 Point 01 AWSではKnowledge Base
for Amazon Bedrockを活⽤することでRAGを簡単に実装可能。 Point 02 サーバレスで構築することで、格安で検証可能。 Point 03

検索拡張生成（RAG）をAWSで作る方法

検索拡張生成（RAG）をAWSで作る方法

More Decks by そのだ

Other Decks in Technology

Featured

Transcript