Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon S3 Vectorsを使って低コストRAGを組んでみる
Search
umehara
August 19, 2025
Technology
160
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Amazon S3 Vectorsを使って低コストRAGを組んでみる
umehara
August 19, 2025
More Decks by umehara
See All by umehara
Infrastructure as Codeのはじめ方 ~NRIネットコム TECH AND DESIGN STUDY #93~
umekou
1
140
AWSサービスアップデート202507.pdf
umekou
0
100
AWSマンスリーアップデートピックアップ!! 2025年4月分
umekou
0
110
コンソールで学ぶ!AWS CodePipelineの機能とオプション
umekou
3
340
AWS Well-Architected Frameworkで学ぶAmazon ECSのセキュリティ対策
umekou
2
310
AWSサービスアップデート 2025/02
umekou
0
110
CloudWatch Container Insightsを使ったAmazon ECSのリソース監視
umekou
1
450
AWSサービスアップデート202412 re:Invent特別編
umekou
0
140
DDoS攻撃への対策できてますか?
umekou
0
40
Other Decks in Technology
See All in Technology
現地で盛り上がった WWDC26 Keynote
zozotech
PRO
1
250
Disciplined Vibes: Scaling AI-Assisted Engineering
sheharyar
0
150
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
3k
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
130
AIのReact習熟度を測る
uhyo
2
620
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
310
AIの性能が向上しても未解決な組織の重大問題は何か?/An Unsolved Organizational Problem in the Age of AI
moriyuya
4
690
2026TECHFRESH畢業分享會 - Lightning Talk - 打造精準高效的 MCP 設計模式與測試實務
line_developers_tw
PRO
0
1.1k
アンオフィシャルな、オフィシャルからのお願い
wyamazak_devrel
0
120
SONiCで構築・運用する生成AI向けパブリッククラウドネットワーク ~実装編~
sonic
0
240
iAEONの段階的リアーキテクト戦略 / iAEON's_Gradual_Re-architecture_Strategy
aeonpeople
0
210
就職⽀援サービスにおけるキャリアアドバイザーのシフトスケジューリング
recruitengineers
PRO
1
150
Featured
See All Featured
Evolving SEO for Evolving Search Engines
ryanjones
0
220
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
490
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
730
Navigating Weather and Climate Data
rabernat
0
220
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
6k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
170
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
410
Skip the Path - Find Your Career Trail
mkilby
1
150
From π to Pie charts
rasagy
0
210
Building Applications with DynamoDB
mza
96
7.1k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.3k
Transcript
Amazon S3 Vectorsを使って 低コストRAGを組んでみる ~NRIネットコム TECH & DESIGN STUDY #75~
2025年08月19日 NRIネットコム株式会社 Webインテグレーション事業部 梅原 航
1 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 基本情報
⚫ 梅原 航(うめはら こう) ⚫ NRIネットコム株式会社 Webインテグレーション事業部(大阪) ⚫ AWSを使ったシステムのインフラ開発・運用に従事 ◼ 受賞歴 ⚫ 2024 Japan AWS Jr. Champion ⚫ 2025 Japan All AWS Certifications Engineer ◼ 好きなAWSサービス ◼ 本日お話すること ⚫ RAGの基礎的な内容 ⚫ Amazon S3 VectorsをRAGで使うメリット・デメリット 自己紹介 Amazon Elastic Container Service (Amazon ECS) #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
2 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 大量のデータを事前に学習させておくことで、自然言語のパターンを理解可能な機械学習モデル
◼ ユーザからの質問への回答を生成することが可能 ◼ 事前に学習されたもの以外は回答できない ⚫ クローズドな情報や最新情報、特定ドメインに特化した内容の回答はできない ⚫ 嘘を付く可能性がある(ハルシネーション) 大規模言語モデル(Large Language Model)とは 生成AIとは 何ですか? 生成AIとは、機械 学習を元に・・・ 大規模言語モデル 社内申請の 仕方を教えて ? GPT Amazon Nova Claude ︙ 大規模言語モデル #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
3 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 検索(Retrieval)によって、拡張(Augmented)された、生成(Generation)
◼ LLMが外部のドキュメントを検索した上で回答を生成する ⚫ クローズドな情報や最新情報、特定ドメインに特化した内容の回答も可能 ⚫ 根拠持った回答 ⚫ ハルシネーションの抑制 RAG(Retrieval Augmented Generation)とは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 大規模言語モデル 社内申請の 仕方を教えて 社内申請は 以下URLの・・・ 社内文書 検索 回答生成
4 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 「文書を検索するフェーズ」と「回答を生成する生成フェーズ」の2つ
◼ 検索フーズ ⚫ ①外部データを細切れにするチャンキング ⚫ ②自然言語を数値で扱えるようにベクトル化(エンベディング、埋め込み) ⚫ ③ユーザからの質問(プロンプト)に関連する外部文書の検索 #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します RAGの仕組み ベクトルデータベース ドキュメント 大規模言語モデル 社内申請の 仕方を教えて ① チャンク チャンク チャンク ② ③
5 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 「文書を検索するフェーズ」と「回答を生成する生成フェーズ」の2つ
◼ 生成フェーズ ⚫ ④検索フェーズで得た情報からユーザへの回答文を生成 RAGの仕組み ベクトルデータベース ドキュメント 大規模言語モデル 社内申請の 仕方を教えて ① チャンク チャンク チャンク ③ #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 社内申請は 以下URLの・・・ ④ ②
6 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ Amazon
Bedrock Knowledge Basesで簡単にRAGを構築可能 ◼ ドキュメントの保存 ⚫ Amazon S3など ◼ 大規模言語モデルの利用 ⚫ Amazon Bedrockで利用可能なモデル ⚫ Bedrockなのでプロンプトが再学習されない ◼ ベクトルデータの保存 ⚫ Amazon OpenSearch ⚫ Amazon Kendraなど AWSでRAGを利用するには Amazon S3 Amazon OpenSearch Service RetrieveAndGenerate API Model Amazon Bedrock Knowledge Bases #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
7 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトルを保存するデータベースのAWS利用料が高額
◼ 東京リージョンでの月額最低価格 ⚫ Amazon OpenSearch Serverless: 120.24 USD~ ⚫ Amazon Kendra: 810 USD~ AWSでRAGの欠点 Amazon S3 Amazon OpenSearch Service Model Amazon Bedrock Knowledge Bases #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
8 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトル検索の機能を持ったベクトルデータ保存用のオブジェクトストレージ
◼ S3がベースなオブジェクトストレージ ⚫ 耐久性がイレブンナイン(99.999999999%) ⚫ データ保存も無制限 ◼ 保存するデータ量による課金なので、ベクトルデータベースと比較して安価 ◼ ベクトルの保存や検索、メタデータ保存の機能が可能 ⚫ OpenSearchのようなハイブリッド検索や高度なフィルタリングといった機能はない ◼ コンソールにベクトルバケットの欄が追加 Amazon S3 Vectorsとは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
9 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトルデータベースの代用として、Amazon
S3 Vectorsを利用 ◼ メリット ⚫ ベクトル保存に対するコスト面が安くなる ◼ デメリット ⚫ レイテンシーの増加(1秒未満) ⚫ 検索性が弱い ◼ ユースケース ⚫ 性能よりコスト重視 ⚫ RAG機能をまずは試したい ⚫ 動画データなどデータ量が多いとき Amazon Bedrock Knowledge BasesでもS3 Vectorsを利用可能 Amazon S3 Model Amazon Bedrock Knowledge Bases Amazon S3 Vectors #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
None