Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
会社の公開ページとKnowledge Base for Amazon Bedrockを使っ...
Search
そのだ
February 19, 2024
Technology
610
0
Share
会社の公開ページとKnowledge Base for Amazon Bedrockを使ってRAG作ってみた
【Doorkeeper】
JAWS-UG沖縄 生成AI特集! 2024年02月
https://jaws-ug-okinawa.doorkeeper.jp/events/167464
そのだ
February 19, 2024
More Decks by そのだ
See All by そのだ
Google_ADKのSub_AgentをAgentic_Workflowに移行し_遷移成功率を改善した話.pdf
sonoda_mj
1
93
仕事はAIに任せてラスベガスへ行きたいのでDSPyで自分のクローンを作った
sonoda_mj
1
140
ハッカソンから社内プロダクトへ AIエージェント「ko☆shi」開発で学んだ4つの重要要素
sonoda_mj
6
2.5k
RAGの基礎から実践運用まで:AWS BedrockとLangfuseで実現する構築・監視・評価
sonoda_mj
1
1.7k
Amazon Bedrock Knowledge Basesに Data Autometionを導入してみた
sonoda_mj
1
210
Amazon Bedrock Knowledge basesにLangfuse導入してみた
sonoda_mj
2
1.1k
AIエージェントに脈アリかどうかを分析させてみた
sonoda_mj
2
410
Amazon Bedrock Knowledge Basesのアップデート紹介
sonoda_mj
2
850
Snowflake未経験の人がSnowflakeに挑戦してみた
sonoda_mj
1
270
Other Decks in Technology
See All in Technology
最近の技術系の話題で気になったもの色々(IoT系以外も) / IoTLT 花見予定会(たぶんBBQ) @都立潮風公園バーベキュー広場
you
PRO
1
150
最初の一歩を踏み出せなかった私が、誰かの背中を押したいと思うようになるまで / give someone a push
mii3king
0
130
New CBs New Challenges
ysuzuki
1
180
新メンバーのために、シニアエンジニアが環境を作る時代
puku0x
0
830
Hooks, Filters & Now Context: Why MCPs Are the “Hooks” of the AI Era
miriamschwab
0
160
ストライクウィッチーズ2期6話のエイラの行動が許せないのでPjMの観点から何をすべきだったのかを考える
ichimichi
1
370
LLM とプロンプトエンジニアリング/チューターを定義する / LLMs and Prompt Engineering, and Defining Tutors
ks91
PRO
0
390
新規サービス開発におけるReact Nativeのリアル〜技術選定の裏側と実践的OSS活用〜
grandbig
2
190
DevOpsDays Tokyo 2026 見えない開発現場を、見える投資に変える
rojoudotcom
3
190
ふりかえりがなかった職能横断チームにふりかえりを導入してみて学んだこと 〜チームのふりかえりを「みんなで未来を考える場」にするプロローグ設計〜
masahiro1214shimokawa
0
390
DIPS2.0データに基づく森林管理における無人航空機の利用状況
naokimuroki
1
210
CDK Insightsで見る、AIによるCDKコード静的解析(+AI解析)
k_adachi_01
2
140
Featured
See All Featured
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
160
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.1k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
240
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
400
sira's awesome portfolio website redesign presentation
elsirapls
0
210
Practical Orchestrator
shlominoach
191
11k
Marketing to machines
jonoalderson
1
5.2k
Making the Leap to Tech Lead
cromwellryan
135
9.8k
Claude Code のすすめ
schroneko
67
220k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
370
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
100
Test your architecture with Archunit
thirion
1
2.2k
Transcript
会社の公開ページとKnowledge Base for Amazon BerdrockでRAG作ってみた JAWS-UG沖縄 ⽣成AI特集︕2024年2⽉ 2024.2.17 苑⽥朝彰 1
⾃⼰紹介 苑⽥ 朝彰 Sonoda Tomotada - ID - Github︓tomomj -
Twitter︓@sonoda_mj - Work at - 株式会社 Fusic (フュージック) 技術創造部⾨所属 - 新卒3年⽬ - 最近MLを勉強し出した - Skill - AWS/React(Native)/Ruby on Rails 2
アジェンダ 3 l 背景 l Knowledge Base for Amazon Bedrockとは
l 会社の公開ページとBedrockでRAG作ってみた l まとめ
01 背景
新しい情報やプライベートの情報に関する 内容について回答してくれる、ChatGPTの ようなアプリを個人開発で作りたい!
でもいいネタが思いつかん!!
参考:https://fusic.co.jp/members
ちょうどええデータ あるやん
これ使ってみよか〜
作ったもの
苑田(webにない情報) って誰ですか? Webアプリ
苑田っていうのはな。。。 Webアプリ
02 Knowledge Base for Amazon Bedrockとは
Knowledge Base for Amazon Bedrockとは 14 "NB[PO#FESPDLͷφϨοδϕʔεΛ༻͢Δͱɺ"NB[PO#FESPDL͔Β '.Λσʔλιʔ εʹଓͯ͠ݕࡧ֦ுੜ 3"(
Λߦ͏͜ͱ͕Ͱ͖Δɻ͜ΕʹΑΓɺ'.ͷطଘͷڧྗͳػೳΛ ֦ு͠ɺಛఆͷυϝΠϯ৫ʹؔ͢ΔࣝΛਂΊΔ͜ͱ͕Ͱ͖Δɻ 引用:https://aws.amazon.com/jp/bedrock/knowledge-bases/
データの前処理 15 引用:https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base.html • ドキュメントを管理しやすいチャンクに分割し、効率的に取得できるようにする • ドキュメントをEmbedding Modelを使用してベクトル化する • Vector
DBに格納する Cohere
ランタイム実⾏ 16 引用:https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base.html • ユーザーのクエリをベクトル化する • ドキュメントのベクトルと比較し、意味的に類似したチャンクが検索される • 取得されたチャンクからの追加のコンテキストで拡張される Cohere
Claude
Knowledge Baseについて詳しく 17 or or Vector Database Data Source S3
Bedrock User LLM 様々な情報を入れる コードを書かなくとも一括で作成してくれる(S3以外) or
03 会社の公開ページとBedrockで RAG作ってみた
データソース 19 Fusicのメンバー紹介(全員分) 参考: https://fusic.co.jp/members/108
構成図 20
構成図 21
None
質問内容 会話履歴を保持するための セッションID
sessionIDを指定しない場合 sessionIDを指定する場合 苑田とは誰ですか? AWSエンジニアです 詳細を教えてください 詳細とは何でしょうか? 苑田とは誰ですか? AWSエンジニアです 詳細を教えてください 彼はAWSだけではなく、Rubyも書ける
ようです。緑のタイツを着ています。 会話情報が保持される
構成図 25
None
構成図 27 毎日データをベクトル化してPineconeに保存している
データを前処理する 28 名前:苑田朝彰 コメント:ほげほげ 略歴:ほげほげ 担当・スキル:ほげほげ プライベート:ほげほげ 必要なところだけ取ったtxtファイル データの抽出
構成図 29 ベクターDB Freeプラン使用
デモ
04 まとめ
まとめ Bedrockを使ってChatGPTのようなアプリを簡単に作ることができた Point 2 sessionIDを使⽤することで、会話履歴が保持された 32 Point 1 Point 3
データの精度を上げるには前処理が重要(かもしれない)
ご清聴いただきありがとうございました Thank You We are Hiring ! https://recruit.fusic.co.jp/
Appendix
検索拡張⽣成(RAG)とは 35 Retrieval Augmented Generation(RAG) 生成系の言語 AI モデルに外部メモリをつけるというコンセプトのことを指す Vector Database
LLM 質問 検索 返答 検索結果 引用:https://github.com/aws-samples/jp-rag-sample
検索拡張⽣成(RAG)とは 36 事前に学習したデータに関しては返答することができる AWSについて教えて AWSってのはな・・・ LLM
検索拡張⽣成(RAG)とは 37 しかし、学習していない内容に関しては答えられない 苑田について教えて 誰やねん 私の知識はxxxx年まででぇ〜
検索拡張⽣成(RAG)とは 38 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関す る回答を生成することができる Vector Database 苑田について教えて 新しいデータをベクトル化 して格納
検索拡張⽣成(RAG)とは 39 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関す る回答を生成することができる Vector Database 近いベクトルを探す 「苑田について教えて」を ベクトル化
検索拡張⽣成(RAG)とは 40 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関す る回答を生成することができる Vector Database 検索結果を返す
検索拡張⽣成(RAG)とは 41 外部のデータベースなどを紐づけることで、新しい情報やプライベートの情報に関す る回答を生成することができる Vector Database 苑田ってのはな