Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGでS3 Vectorを使おう
Search
八雲慎之助
July 26, 2025
1
200
RAGでS3 Vectorを使おう
【満員御礼】JAWS-UG 栃木 オフライン #3
八雲慎之助
July 26, 2025
Tweet
Share
More Decks by 八雲慎之助
See All by 八雲慎之助
BedrockでNL2SQLをやってみる
yakumo
1
55
Amazon Q CLI と MCPで Neptuneを自然言語で触ってみよう
yakumo
0
62
Amazon Neptune Graph Explorerのアプデについて
yakumo
0
100
Amazon Neptune で始めるグラフDB
yakumo
0
46
Knowledge BasesにRAGが対応しました!
yakumo
0
150
Jr.Championsになるための取り組みと期待すること
yakumo
1
250
2024年振り返り
yakumo
0
36
Neptune使ってみた
yakumo
0
52
AWS GameDayに参加してきた
yakumo
1
300
Featured
See All Featured
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
8
460
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Why Our Code Smells
bkeepers
PRO
338
57k
A Modern Web Designer's Workflow
chriscoyier
695
190k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Six Lessons from altMBA
skipperchong
28
4k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
How GitHub (no longer) Works
holman
314
140k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Git: the NoSQL Database
bkeepers
PRO
431
65k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
1.1k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
Transcript
RAGでS3 Vectorを使おう
所属:株式会社クレスコ 好きなサービス:Amazon Neptune 年次:2年目 経歴: 2024年4月 株式会社クレスコ入社 2024年7月 ビジネスソリューション事業部配属 2025年6月
2025 Japan AWS Jr.Champion 名前:八雲 慎之助
None
None
None
None
• 埋め込みを利用 • 自然言語を機械が理解しやすい数値の羅列に変換 • ベクトルとして保存する https://aws.amazon.com/jp/what-is/embeddings-in-machine-learning/
None
None
None
https://aws.amazon.com/jp/blogs/aws/introducing-amazon-s3-vectors-first-cloud-storage-with- native-vector-support-at-scale/
• S3 Vector bucket • S3 Vector index
None
•ディメンション •距離メトリック •コサイン •ユークリッド
•ディメンション 利用する埋め込みモデルに合わせる必要あり 「Amazon Titan Text Embedding V2」だと 1024となる 高次元・・・精度が高いが、コスト高、 処理に時間
低次元・・・処理は軽いが、情報量が 減り正確性も不安
•距離メトリック •コサイン →ベクトルの「傾き」の近さを見る 意味ベースでの検索に強い •ユークリッド →ベクトルの距離を見る データのばらつきがないと 安定した比較ができる
None
• 圧倒的なコスト削減 →約90%削減 →コストは基本的にS3ベース.. 課金されるのはストレージくらい • Amazon OpenSearch Service との連携
→S3 Vectorからエクスポートが可能 →検索速度はOpenSearch Service の方が有利 S3 Vector 1秒程度 OpenSearch Service 数ミリ秒で完了
正確性 忠実性 有用性 完全性
正確性 忠実性 有用性 完全性
① ②
None
None
None
• S3 Vector は圧倒的コスパナレッジベース! • 約9割削減 • RAG評価もそこまで悪くない! • OpenSearch
Serverlssとの使い分け • コスト重視、たまにしか参照しない • 頻繁に参照、レスポンスも重視したい • S3 VectorからOpenSearch Serverlssへの移行も可能