Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon S3 Vectorsを使って低コストRAGを組んでみる
Search
umehara
August 19, 2025
Technology
160
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Amazon S3 Vectorsを使って低コストRAGを組んでみる
umehara
August 19, 2025
More Decks by umehara
See All by umehara
Infrastructure as Codeのはじめ方 ~NRIネットコム TECH AND DESIGN STUDY #93~
umekou
1
140
AWSサービスアップデート202507.pdf
umekou
0
100
AWSマンスリーアップデートピックアップ!! 2025年4月分
umekou
0
110
コンソールで学ぶ!AWS CodePipelineの機能とオプション
umekou
3
340
AWS Well-Architected Frameworkで学ぶAmazon ECSのセキュリティ対策
umekou
2
310
AWSサービスアップデート 2025/02
umekou
0
110
CloudWatch Container Insightsを使ったAmazon ECSのリソース監視
umekou
1
450
AWSサービスアップデート202412 re:Invent特別編
umekou
0
140
DDoS攻撃への対策できてますか?
umekou
0
40
Other Decks in Technology
See All in Technology
LayerX コーポレートエンジニアリング室におけるサプライチェーンセキュリティへの取り組み / Supply Chain Security at LayerX Corporate Engineering
yuyatakeyama
2
620
なぜ Platform Engineering の土台に Kubernetes を選ぶのか
r4ynode
2
650
連合学習と機密コンピューティング
lycorptech_jp
PRO
0
120
Oracle AI Database@Azure:サービス概要のご紹介
oracle4engineer
PRO
6
2k
「エンジニア進化論」2028年の開発完全自動化、エンジニアはどう進化するか
cyberagentdevelopers
PRO
6
5.3k
LayerXにおけるセキュリティ管理の現在地と次の一手
tosho
0
220
ACE-Step-1.5で見る 音楽生成AIのしくみと“破綻だけ直す”Retake機能の開発【zennfes spring 2026 登壇資料】
personabb
1
510
Claude Codeをどのように キャッチアップしているか
oikon48
13
8.3k
不要なレビューをAIにまかせて AIコーディングの環境改善を加速した
shoota
1
190
やさしいA2A入門
minorun365
PRO
12
1.9k
現地で盛り上がった WWDC26 Keynote
zozotech
PRO
1
250
脆弱性対応、どこで線を引くか
rymiyamoto
1
400
Featured
See All Featured
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
230
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
240
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.3k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
590
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Designing Experiences People Love
moore
143
24k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
The SEO Collaboration Effect
kristinabergwall1
1
490
Faster Mobile Websites
deanohume
310
31k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
160
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
170
Transcript
Amazon S3 Vectorsを使って 低コストRAGを組んでみる ~NRIネットコム TECH & DESIGN STUDY #75~
2025年08月19日 NRIネットコム株式会社 Webインテグレーション事業部 梅原 航
1 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 基本情報
⚫ 梅原 航(うめはら こう) ⚫ NRIネットコム株式会社 Webインテグレーション事業部(大阪) ⚫ AWSを使ったシステムのインフラ開発・運用に従事 ◼ 受賞歴 ⚫ 2024 Japan AWS Jr. Champion ⚫ 2025 Japan All AWS Certifications Engineer ◼ 好きなAWSサービス ◼ 本日お話すること ⚫ RAGの基礎的な内容 ⚫ Amazon S3 VectorsをRAGで使うメリット・デメリット 自己紹介 Amazon Elastic Container Service (Amazon ECS) #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
2 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 大量のデータを事前に学習させておくことで、自然言語のパターンを理解可能な機械学習モデル
◼ ユーザからの質問への回答を生成することが可能 ◼ 事前に学習されたもの以外は回答できない ⚫ クローズドな情報や最新情報、特定ドメインに特化した内容の回答はできない ⚫ 嘘を付く可能性がある(ハルシネーション) 大規模言語モデル(Large Language Model)とは 生成AIとは 何ですか? 生成AIとは、機械 学習を元に・・・ 大規模言語モデル 社内申請の 仕方を教えて ? GPT Amazon Nova Claude ︙ 大規模言語モデル #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
3 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 検索(Retrieval)によって、拡張(Augmented)された、生成(Generation)
◼ LLMが外部のドキュメントを検索した上で回答を生成する ⚫ クローズドな情報や最新情報、特定ドメインに特化した内容の回答も可能 ⚫ 根拠持った回答 ⚫ ハルシネーションの抑制 RAG(Retrieval Augmented Generation)とは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 大規模言語モデル 社内申請の 仕方を教えて 社内申請は 以下URLの・・・ 社内文書 検索 回答生成
4 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 「文書を検索するフェーズ」と「回答を生成する生成フェーズ」の2つ
◼ 検索フーズ ⚫ ①外部データを細切れにするチャンキング ⚫ ②自然言語を数値で扱えるようにベクトル化(エンベディング、埋め込み) ⚫ ③ユーザからの質問(プロンプト)に関連する外部文書の検索 #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します RAGの仕組み ベクトルデータベース ドキュメント 大規模言語モデル 社内申請の 仕方を教えて ① チャンク チャンク チャンク ② ③
5 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 「文書を検索するフェーズ」と「回答を生成する生成フェーズ」の2つ
◼ 生成フェーズ ⚫ ④検索フェーズで得た情報からユーザへの回答文を生成 RAGの仕組み ベクトルデータベース ドキュメント 大規模言語モデル 社内申請の 仕方を教えて ① チャンク チャンク チャンク ③ #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 社内申請は 以下URLの・・・ ④ ②
6 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ Amazon
Bedrock Knowledge Basesで簡単にRAGを構築可能 ◼ ドキュメントの保存 ⚫ Amazon S3など ◼ 大規模言語モデルの利用 ⚫ Amazon Bedrockで利用可能なモデル ⚫ Bedrockなのでプロンプトが再学習されない ◼ ベクトルデータの保存 ⚫ Amazon OpenSearch ⚫ Amazon Kendraなど AWSでRAGを利用するには Amazon S3 Amazon OpenSearch Service RetrieveAndGenerate API Model Amazon Bedrock Knowledge Bases #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
7 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトルを保存するデータベースのAWS利用料が高額
◼ 東京リージョンでの月額最低価格 ⚫ Amazon OpenSearch Serverless: 120.24 USD~ ⚫ Amazon Kendra: 810 USD~ AWSでRAGの欠点 Amazon S3 Amazon OpenSearch Service Model Amazon Bedrock Knowledge Bases #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
8 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトル検索の機能を持ったベクトルデータ保存用のオブジェクトストレージ
◼ S3がベースなオブジェクトストレージ ⚫ 耐久性がイレブンナイン(99.999999999%) ⚫ データ保存も無制限 ◼ 保存するデータ量による課金なので、ベクトルデータベースと比較して安価 ◼ ベクトルの保存や検索、メタデータ保存の機能が可能 ⚫ OpenSearchのようなハイブリッド検索や高度なフィルタリングといった機能はない ◼ コンソールにベクトルバケットの欄が追加 Amazon S3 Vectorsとは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
9 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトルデータベースの代用として、Amazon
S3 Vectorsを利用 ◼ メリット ⚫ ベクトル保存に対するコスト面が安くなる ◼ デメリット ⚫ レイテンシーの増加(1秒未満) ⚫ 検索性が弱い ◼ ユースケース ⚫ 性能よりコスト重視 ⚫ RAG機能をまずは試したい ⚫ 動画データなどデータ量が多いとき Amazon Bedrock Knowledge BasesでもS3 Vectorsを利用可能 Amazon S3 Model Amazon Bedrock Knowledge Bases Amazon S3 Vectors #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
None