Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon S3 Vectorsを使って低コストRAGを組んでみる
Search
NRI Netcom
PRO
August 25, 2025
Technology
230
7
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Amazon S3 Vectorsを使って低コストRAGを組んでみる
NRI Netcom
PRO
August 25, 2025
More Decks by NRI Netcom
See All by NRI Netcom
AWSマンスリーアップデートピックアップ 2026年5月分
nrinetcom
PRO
0
70
Keynoteから考える、AIエージェント時代で何が変わるのか?
nrinetcom
PRO
0
77
「Google Cloud Next '26」で発表された、BigQueryの最新機能を使ってみよう
nrinetcom
PRO
0
74
Gemini Code AssistとGeminiCLIの活用例
nrinetcom
PRO
0
68
AI時代に求められる思考のパラダイムシフト
nrinetcom
PRO
1
190
ジュニアエンジニアはSREとどう向き合うべきか
nrinetcom
PRO
1
160
AWS認定資格は本当に意味があるのか?
nrinetcom
PRO
7
5.7k
AWSマンスリーアップデートピックアップ 2026年3月分
nrinetcom
PRO
0
99
昔話で振り返るAWSの歩み ~S3誕生から20年、クラウドはどう進化したのか~
nrinetcom
PRO
0
260
Other Decks in Technology
See All in Technology
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
310
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.9k
脆弱性対応、どこで線を引くか
rymiyamoto
1
390
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
1.1k
SONiCで構築・運用する生成AI向けパブリッククラウドネットワーク ~実装編~
sonic
0
220
なぜ Platform Engineering の土台に Kubernetes を選ぶのか
r4ynode
2
640
FinOps × AIエージェントで実現する コストインシデントの自動調査
oasis1994liveforever
0
140
データサイエンスを価値につなげるプロジェクト設計 〜 DS一年目が現場で得た気づき 〜
ysd113
1
260
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
350
AIエージェントが名古屋の猛暑からあなたを守る
happysamurai294
0
120
スキルと MCP ツール、責務をどう分けるか? AI が迷わないインターフェース設計の戦略
cdataj
1
1.1k
Chainlitで作るお手軽チャットUI
ynt0485
0
260
Featured
See All Featured
Mind Mapping
helmedeiros
PRO
1
250
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
HTML-Aware ERB: The Path to Reactive Rendering @ RubyCon 2026, Rimini, Italy
marcoroth
1
190
For a Future-Friendly Web
brad_frost
183
10k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
6k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
940
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
430
Un-Boring Meetings
codingconduct
0
310
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
200
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
840
How to Think Like a Performance Engineer
csswizardry
28
2.7k
How to make the Groovebox
asonas
2
2.2k
Transcript
Amazon S3 Vectorsを使って 低コストRAGを組んでみる ~NRIネットコム TECH & DESIGN STUDY #75~
2025年08月19日 NRIネットコム株式会社 Webインテグレーション事業部 梅原 航
1 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 基本情報
⚫ 梅原 航(うめはら こう) ⚫ NRIネットコム株式会社 Webインテグレーション事業部(大阪) ⚫ AWSを使ったシステムのインフラ開発・運用に従事 ◼ 受賞歴 ⚫ 2024 Japan AWS Jr. Champion ⚫ 2025 Japan All AWS Certifications Engineer ◼ 好きなAWSサービス ◼ 本日お話すること ⚫ RAGの基礎的な内容 ⚫ Amazon S3 VectorsをRAGで使うメリット・デメリット 自己紹介 Amazon Elastic Container Service (Amazon ECS) #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
2 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 大量のデータを事前に学習させておくことで、自然言語のパターンを理解可能な機械学習モデル
◼ ユーザからの質問への回答を生成することが可能 ◼ 事前に学習されたもの以外は回答できない ⚫ クローズドな情報や最新情報、特定ドメインに特化した内容の回答はできない ⚫ 嘘を付く可能性がある(ハルシネーション) 大規模言語モデル(Large Language Model)とは 生成AIとは 何ですか? 生成AIとは、機械 学習を元に・・・ 大規模言語モデル 社内申請の 仕方を教えて ? GPT Amazon Nova Claude ︙ 大規模言語モデル #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
3 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 検索(Retrieval)によって、拡張(Augmented)された、生成(Generation)
◼ LLMが外部のドキュメントを検索した上で回答を生成する ⚫ クローズドな情報や最新情報、特定ドメインに特化した内容の回答も可能 ⚫ 根拠持った回答 ⚫ ハルシネーションの抑制 RAG(Retrieval Augmented Generation)とは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 大規模言語モデル 社内申請の 仕方を教えて 社内申請は 以下URLの・・・ 社内文書 検索 回答生成
4 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 「文書を検索するフェーズ」と「回答を生成する生成フェーズ」の2つ
◼ 検索フーズ ⚫ ①外部データを細切れにするチャンキング ⚫ ②自然言語を数値で扱えるようにベクトル化(エンベディング、埋め込み) ⚫ ③ユーザからの質問(プロンプト)に関連する外部文書の検索 #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します RAGの仕組み ベクトルデータベース ドキュメント 大規模言語モデル 社内申請の 仕方を教えて ① チャンク チャンク チャンク ② ③
5 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 「文書を検索するフェーズ」と「回答を生成する生成フェーズ」の2つ
◼ 生成フェーズ ⚫ ④検索フェーズで得た情報からユーザへの回答文を生成 RAGの仕組み ベクトルデータベース ドキュメント 大規模言語モデル 社内申請の 仕方を教えて ① チャンク チャンク チャンク ③ #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 社内申請は 以下URLの・・・ ④ ②
6 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ Amazon
Bedrock Knowledge Basesで簡単にRAGを構築可能 ◼ ドキュメントの保存 ⚫ Amazon S3など ◼ 大規模言語モデルの利用 ⚫ Amazon Bedrockで利用可能なモデル ⚫ Bedrockなのでプロンプトが再学習されない ◼ ベクトルデータの保存 ⚫ Amazon OpenSearch ⚫ Amazon Kendraなど AWSでRAGを利用するには Amazon S3 Amazon OpenSearch Service RetrieveAndGenerate API Model Amazon Bedrock Knowledge Bases #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
7 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトルを保存するデータベースのAWS利用料が高額
◼ 東京リージョンでの月額最低価格 ⚫ Amazon OpenSearch Serverless: 120.24 USD~ ⚫ Amazon Kendra: 810 USD~ AWSでRAGの欠点 Amazon S3 Amazon OpenSearch Service Model Amazon Bedrock Knowledge Bases #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
8 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトル検索の機能を持ったベクトルデータ保存用のオブジェクトストレージ
◼ S3がベースなオブジェクトストレージ ⚫ 耐久性がイレブンナイン(99.999999999%) ⚫ データ保存も無制限 ◼ 保存するデータ量による課金なので、ベクトルデータベースと比較して安価 ◼ ベクトルの保存や検索、メタデータ保存の機能が可能 ⚫ OpenSearchのようなハイブリッド検索や高度なフィルタリングといった機能はない ◼ コンソールにベクトルバケットの欄が追加 Amazon S3 Vectorsとは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
9 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトルデータベースの代用として、Amazon
S3 Vectorsを利用 ◼ メリット ⚫ ベクトル保存に対するコスト面が安くなる ◼ デメリット ⚫ レイテンシーの増加(1秒未満) ⚫ 検索性が弱い ◼ ユースケース ⚫ 性能よりコスト重視 ⚫ RAG機能をまずは試したい ⚫ 動画データなどデータ量が多いとき Amazon Bedrock Knowledge BasesでもS3 Vectorsを利用可能 Amazon S3 Model Amazon Bedrock Knowledge Bases Amazon S3 Vectors #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
None