Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた(リベ...
Search
KMiura
August 27, 2024
0
170
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた (リベンジ編)
2024/8/27 「製造業でも生成AI活用したい!名古屋LLM MeetUp#2」
https://kinto-technologies.connpass.com/event/325725/
KMiura
August 27, 2024
Tweet
Share
More Decks by KMiura
See All by KMiura
Lambdaと共に歩んだAWS
miura55
3
370
Is it wrong to use a web framework with Lambda?
miura55
0
130
Bedrock Knowledge baseを使って今年の上半期のニュースを聞いてみた
miura55
0
150
AWS×IoTについて語り合う会
miura55
0
93
クラウドを活用して家電をハックしてみた
miura55
0
97
Amplify Gen2でLambda構築してみた
miura55
0
130
Amplify Gen2でLambda構築してみた
miura55
1
910
Amplify Gen2がGAされたので試してみた
miura55
0
150
VS CodeとVimが好きなエンジニアが考えた最強のエディタ
miura55
0
300
Featured
See All Featured
Intergalactic Javascript Robots from Outer Space
tanoku
269
27k
Being A Developer After 40
akosma
86
590k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
The Language of Interfaces
destraynor
154
24k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
How to Think Like a Performance Engineer
csswizardry
20
1.1k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.3k
Mobile First: as difficult as doing things right
swwweet
222
8.9k
The Pragmatic Product Professional
lauravandoore
31
6.3k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
364
24k
Agile that works and the tools we love
rasmusluckow
327
21k
Six Lessons from altMBA
skipperchong
27
3.5k
Transcript
Bedrock Knowledge baseを使って今年 の上半期のニュースを聞いてみた (リベンジ編) KMiura(@k_miura_io)
自己紹介 • 三浦 耕生(こうき) • Acallのバックエンドエンジニア • JAWS UG名古屋&神戸 運営
• Cloudflare Meetup名古屋 運営 • 鯱.py 運営 @k_miura_io koki.miura05
このイベントでやったLT覚えてますか?
LTについて今北産業 • Step FunctionsでNews APIを使ってその日のヘッ ドラインニュースをSlackのAPIで投稿するワークフ ロー作った • Slackで投稿するだけではなくAPIのレスポンスログ をS3に溜め込むETL的な機能も用意
• S3に溜め込んだデータをそのままBedrockに使うと いう話
S3のデータをKnowledgebaseにできる 仕組みがあるらしい • Amazon BedrockのKnowledgebaseを使うとS3をソースにフルマネージドなRAGを実現 できそう • 調べてみると外部のベクトルデータベースを使う方法があるが、わざわざ用意しなくても OpenSearch Serverlessを使うことができる(むしろ今のところそれが推奨っぽい)
実際にデモチャットで確認 • 答えは帰って来るがなんか微妙… • 日付周りが結構弱い
どうすれば精度上がりそう? • 読み込ませたソースになっているファイルがAPIのレスポンスをそのまま保存して いるだけなのでCSVとかで整形したほうがいいかも • ソースごとにメタデータ情報を記載したjsonファイルをバケットに足すことで応答精 度が上がるそう 今回はこれを試してリベンジする話
データ生成のフロー • すでに存在するAPIのレスポンスログを溜め込むバケットにデータが保存されたこ とをトリガーでKnowledge Base用のデータを整形 • SQSに流し込んでLambdaでCSVとmetadataのjsonの生成を自動化 • ベクトルデータベースにはPineconeを使用(OpenSearchは高すぎるw)
生成したデータフォーマット
metadata { "metadataAttributes":{ ”year":”2024" } }
それっぽい返答が 出るようになった
上半期のニュースも 抽出できた
DEMO
まとめ • BedrockのKnowledge Baseに対応したデータフォーマットに変換するこ とでAWS上で手軽にRAGを実現できる • metadataを活用することでより適切なデータを取得できた • 多少コードが書けるとデータ整形の自動化がだいぶ楽になる
宣伝 https://bit.ly/4dBnLIf
END