Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGでS3 Vectorを使おう
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
やくも
July 26, 2025
350
1
Share
RAGでS3 Vectorを使おう
【満員御礼】JAWS-UG 栃木 オフライン #3
やくも
July 26, 2025
More Decks by やくも
See All by やくも
AgentCoreとLINEを使った飲食店おすすめアプリを作ってみた
yakumo
2
270
StrandsとNeptuneを使ってナレッジグラフを構築する
yakumo
2
500
なんとなくの実装を抜け出す!10分でおさらいするAgentCoreの認証・認可
yakumo
2
270
AWSと生成AIで学ぶ!実行計画の読み解き方とSQLチューニングの実践
yakumo
3
1.3k
AIエージェントを5分で一気におさらい!AIエージェント「構築」元年に備えよう
yakumo
1
180
AI時代のワークフロー設計〜Durable Functions / Step Functions / Strands Agents を添えて〜
yakumo
5
3.7k
AIの長期記憶と短期記憶の違いについてAgentCoreを例に深掘ってみた
yakumo
5
580
品川会立ち上げについて
yakumo
1
370
5分で体感するhuman-in-the-loop!AIに丸投げはもうやめよう!
yakumo
1
430
Featured
See All Featured
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
260
It's Worth the Effort
3n
188
29k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
68
38k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
160
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.5k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.2k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
140
KATA
mclloyd
PRO
35
15k
Agile that works and the tools we love
rasmusluckow
331
21k
Google's AI Overviews - The New Search
badams
0
950
Transcript
RAGでS3 Vectorを使おう
所属:株式会社クレスコ 好きなサービス:Amazon Neptune 年次:2年目 経歴: 2024年4月 株式会社クレスコ入社 2024年7月 ビジネスソリューション事業部配属 2025年6月
2025 Japan AWS Jr.Champion 名前:八雲 慎之助
None
None
None
None
• 埋め込みを利用 • 自然言語を機械が理解しやすい数値の羅列に変換 • ベクトルとして保存する https://aws.amazon.com/jp/what-is/embeddings-in-machine-learning/
None
None
None
https://aws.amazon.com/jp/blogs/aws/introducing-amazon-s3-vectors-first-cloud-storage-with- native-vector-support-at-scale/
• S3 Vector bucket • S3 Vector index
None
•ディメンション •距離メトリック •コサイン •ユークリッド
•ディメンション 利用する埋め込みモデルに合わせる必要あり 「Amazon Titan Text Embedding V2」だと 1024となる 高次元・・・精度が高いが、コスト高、 処理に時間
低次元・・・処理は軽いが、情報量が 減り正確性も不安
•距離メトリック •コサイン →ベクトルの「傾き」の近さを見る 意味ベースでの検索に強い •ユークリッド →ベクトルの距離を見る データのばらつきがないと 安定した比較ができる
None
• 圧倒的なコスト削減 →約90%削減 →コストは基本的にS3ベース.. 課金されるのはストレージくらい • Amazon OpenSearch Service との連携
→S3 Vectorからエクスポートが可能 →検索速度はOpenSearch Service の方が有利 S3 Vector 1秒程度 OpenSearch Service 数ミリ秒で完了
正確性 忠実性 有用性 完全性
正確性 忠実性 有用性 完全性
① ②
None
None
None
• S3 Vector は圧倒的コスパナレッジベース! • 約9割削減 • RAG評価もそこまで悪くない! • OpenSearch
Serverlssとの使い分け • コスト重視、たまにしか参照しない • 頻繁に参照、レスポンスも重視したい • S3 VectorからOpenSearch Serverlssへの移行も可能