Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
5分で分かる(かもしれない) Vector engine for OpenSearch Ser...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
つくぼし
May 12, 2024
Technology
2.1k
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
5分で分かる(かもしれない) Vector engine for OpenSearch Serverless
つくぼし
May 12, 2024
More Decks by つくぼし
See All by つくぼし
[モダンアプリ勉強会]今更聞けないGit/GitHub入門
tsukuboshi
0
360
世界の中心でApp Runnerを叫ぶ FINAL
tsukuboshi
0
330
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
1.8k
Mastraに入門してみた ~AWS CDKを添えて~
tsukuboshi
0
1.4k
Amazon Bedrock GenUハンズオン座学資料 #2 GenU環境でRAGを体験してみよう
tsukuboshi
0
810
Amazon Bedrock GenUハンズオン座学資料 #1 GenU環境で生成AIを体験してみよう
tsukuboshi
0
1.5k
AWSエンジニアに捧ぐLangChainの歩き方
tsukuboshi
5
2.3k
世界の中心でApp Runnerを叫ぶ ~Aurora DSQLを添えて~
tsukuboshi
0
900
初めてのGPTs ~ネコ派を〇〇派に変える技術~
tsukuboshi
0
1.1k
Other Decks in Technology
See All in Technology
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
130
Snowflakeと仲良くなる第一歩
coco_se
4
410
Claude Code×Terraform IaC テンプレート駆動開発
itouhi
1
490
AI駆動開発を通して感じた、 AI時代のデザイナーの役割変化
whisaiyo
0
190
日本 Fintech 未来予測レポート 2027〜2028年(オリジナル版)
8maki
0
1.3k
FDE という解 ― 暗黙知と明示知をつなぐ、伴走型エンジニアリング ―
otanet
0
130
Building applications in the Gemini API family.
line_developers_tw
PRO
0
2.8k
Chainlitで作るお手軽チャットUI
ynt0485
0
170
Agentic Web
dynamis
1
200
RSA暗号を手計算したくなること、ありますよね?? (20260615_orestudy6_rsa)
thousanda
0
180
2026TECHFRESH畢業分享會 - 葬送的通靈師:化系統與用戶雜訊成行動訊號
line_developers_tw
PRO
0
710
2026TECHFRESH畢業分享會 - Lightning Talk - E起 See See : 電商推薦讀心術? 數據說了算
line_developers_tw
PRO
0
700
Featured
See All Featured
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
The untapped power of vector embeddings
frankvandijk
2
1.8k
GraphQLとの向き合い方2022年版
quramy
50
15k
Test your architecture with Archunit
thirion
1
2.3k
Odyssey Design
rkendrick25
PRO
2
690
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
320
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
160
Information Architects: The Missing Link in Design Systems
soysaucechin
0
970
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
390
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
Transcript
5分で分かる(かもしれない) Vector engine for OpenSearch Serverless 1 2024.5.15 JAWS-UG東京
ランチタイムLT会 #10
57分で分かる(かもしれない) Vector engine for OpenSearch Serverless 2 2024.5.15 JAWS-UG東京
ランチタイムLT会 #10
3 自己紹介 ★ ハンドルネーム ◦ つくぼし ★ 所属 ◦ AWS事業本部コンサルティング部
◦ ソリューションアーキテクト ★ 最近ハマっているAWSサービス ◦ AWS Application Composer ★ SNS/ブログ ◦ Twitter(@tsukuboshi0755) ◦ DevelopersIO(つくぼし)
4 今日話す事・話さない事 • 話す事 ◦ Vector engine for OpenSearch Servelessの概念
◦ OpenSearch Serverlessを使う際の考慮点 • 話さない事 ◦ OpenSearchにおけるインデックス作成方法 ◦ ベクトルデータベースを用いた検索方法 ◦ その他OpenSearch Serverlessの詳細な仕組み
5 Vector engine for OpenSearch Serverless は知ってますか?
6 Knowledge Bases for Amazon Bedrockの作成画面 ベクトルデータベースの第 一選択肢
7 Vector engine for OpenSearch Serverlessとは?
• AWS上でマネージドに提供される全文検索エンジン ◦ 全文検索とは、複数ファイルにまたがり特定の文字列を検索する事 ◦ インデックスという単位でドキュメントを格納し、全文検索を行う ◦ RDBMSにおけるSQLのLike検索と比較して、検索速度や精度の観点で優位 • 元々はElasticSearchという他社サービスから派生
◦ アプリケーションにおける大量のログ分析等で使用する事が多い ◦ ライセンス体系が変更された影響で、元のElasticSearchからOSS管理の OpenSearchにフォークされた 8 Amazon OpenSearch Serviceとは?
• Amazon OpenSearch Serviceにおける インフラ管理モードの1つ ◦ Managed Clusters:クラスターという単位で作 成し、原則ユーザーがノード(インスタンス)を自 前管理する必要がある
◦ Serverless:コレクションという単位で作成し、 AWSが必要なノード(インスタンス)を自動ス ケーリングしてくれる 9 OpenSearch Serverlessとは? 参照:Amazon OpenSearch Serverless が一般利用可能になりました | Amazon Web Services ブログ
10 Vector engine for OpenSearch Serverlessとは? • OpenSearch Serverlessにおけるコレクションタイプの1つ ◦
元々は検索または時系列のみだったが、後にベクトル検索が選択可能に ◦ ベクトル検索:数値ベクトルに変換された文字や画像、音声等のデータ(埋め込み) の類似度を比較、関連性の高いデータを見つけ出す検索方法 • 生成AIを用いたRAG構築におけるベクトルデータストアとして最適 参照:生成系 AI アプリケーションでベクトルデータストアが果たす役割とは | Amazon Web Services ブログ
11 Vector engine for OpenSearch Serverless を使う際の考慮ポイント
12 デプロイタイプ(開発/テストモード) • コレクション作成時に、レプリカの 有効化/無効化を選択可能 ◦ レプリカを無効化する事で、コストを 削減できる(開発/テストモード) ◦ 一方でレプリカを無効化すると、可
用性が失われるデメリットもあり
13 データアクセスポリシー • 以下の権限を、特定の IAMエンティティに対して定 義 ◦ コレクション全体に対す るアクセス権限 ◦
各インデックスに対する アクセス権限 • JSON形式で作成/変更可 能可能 # ポリシー例 [ { "Rules": [ { "Resource": [ "collection/<コレクション名>" ], "Permission": [ "aoss:DescribeCollectionItems", "aoss:CreateCollectionItems", "aoss:UpdateCollectionItems" ], "ResourceType": "collection" }, { "Resource": [ "index/<インデックス名>/*" ], "Permission": [ "aoss:UpdateIndex", "aoss:DescribeIndex", "aoss:ReadDocument", "aoss:WriteDocument", "aoss:CreateIndex" ], "ResourceType": "index" } ], "Principal": [ "<IAMロールARN>" ], "Description": "" } ]
14 暗号化ポリシー • データの暗号化に、以下のいずれかのKMSを指定 ◦ AWSマネージドキー ◦ カスタマーマネージドキー • コンソールからビジュアルで作成/変更可能
15 ネットワークポリシー • 以下のNWアクセスを定義 ◦ パブリックアクセスまたは VPCアクセス ◦ ダッシュボードへのアクセス 有効化
◦ エンドポイントへのアクセス有 効化 • コンソールからビジュアルで作成 /変更可能
16 (補足)Knowledge Baseで自動作成されるインデックス • OpenSearchコンソールでコレクションを作成すると、コレクション内にイン デックスは作成されない • BedrockコンソールでKnowledge Baseを作成する場合のみ、以下のよ うなデフォルトインデックスがコレクション内に作成される
17 ほかにも説明し切れない箇所がたくさん...
18 今回の教訓 5分での説明は無理ゲーだと分かった
19