Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
OSS分散ベクトル検索エンジンValdと最新の取り組み
Search
Matts966
August 20, 2025
Programming
0
100
OSS分散ベクトル検索エンジンValdと最新の取り組み
Matts966
August 20, 2025
Tweet
Share
More Decks by Matts966
See All by Matts966
Grafana Dashboard as Code using Grafana Foundation SDK
matts966
3
230
nilarg
matts966
0
160
Static Analysis in Go
matts966
0
3.1k
Phics
matts966
0
82
Other Decks in Programming
See All in Programming
メルカリのリーダビリティチームが取り組む、AI時代のスケーラブルな品質文化
cloverrose
2
440
まだ間に合う!Claude Code元年をふりかえる
nogu66
5
920
[AI Engineering Summit Tokyo 2025] LLMは計画業務のゲームチェンジャーか? 最適化業務における活⽤の可能性と限界
terryu16
1
200
ELYZA_Findy AI Engineering Summit登壇資料_AIコーディング時代に「ちゃんと」やること_toB LLMプロダクト開発舞台裏_20251216
elyza
2
880
ZJIT: The Ruby 4 JIT Compiler / Ruby Release 30th Anniversary Party
k0kubun
1
310
愛される翻訳の秘訣
kishikawakatsumi
3
370
Grafana:建立系統全知視角的捷徑
blueswen
0
270
C-Shared Buildで突破するAI Agent バックテストの壁
po3rin
0
430
Java 25, Nuevas características
czelabueno
0
130
Patterns of Patterns
denyspoltorak
0
410
「コードは上から下へ読むのが一番」と思った時に、思い出してほしい話
panda728
PRO
39
26k
Go コードベースの構成と AI コンテキスト定義
andpad
0
150
Featured
See All Featured
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
74
Raft: Consensus for Rubyists
vanstee
141
7.3k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
1k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
120
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
860
What the history of the web can teach us about the future of AI
inesmontani
PRO
0
390
New Earth Scene 8
popppiees
0
1.3k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
64
Six Lessons from altMBA
skipperchong
29
4.1k
Transcript
Vald: The Cloud-Native Vector Database Built for Scale Grafana Dashboards,
YAML-Driven E2E, and Neutral Decision Guides for Kubernetes CNCF 10th Anniversary LINEヤフー株式会社 Matts966 資料URL © vdaas/vald 1
自己紹介 松井誠泰(GitHub: Matts966) LINEヤフー株式会社 OSSのベクトルデータベースValdチームに転職して半年 趣味 © vdaas/vald 2
お品書き Valdのご紹介 最新の取り組み Grafana Foundation SDKを用いたGrafana Dashboard as Code E2E
V2: YAMLで宣言的にテストシナリオを記述 ベクトルDB選定のすすめ © vdaas/vald 3
Valdのご紹介 クラウドネイティブな分 散近似近傍ベクトルDB オープンソース CNCF Landscape vald.vdaas.org © vdaas/vald 4
最新の取り組み 1. Grafana Foundation SDKを用いたGrafana Dashboard as Code 2. E2E
V2: YAMLで宣言的にテストシナリオを記述 © vdaas/vald 5
Grafanaボード管理の課題 コンポーネント毎にボード・パネルをたくさん管理 コンポーネントがかなり違うものの共通化の余地あり 繰り返し、条件分岐したい パネル毎にアップグレード作業 JSONでバージョン管理はしていたものの シンプルなパネルでもGUIからexportされたJSONは大きくな ってしまい、直接読み書きするのが難しい © vdaas/vald
6
grafana-foundation-sdk の概要 Grafana公式が提供する言語ごとのSDK GrafanaのAPIスキーマをベースに自動生成されている Go, TypeScript, Python, Java に対応 ©
vdaas/vald 7
選定理由・メリット 繰り返しを簡単に表現できる 同じようなダッシュボードをコンポーネントごとにつくっている場合などに、関 数等で整理しやすい メトリクスを管理しているコードと同じ言語で書くことで、メトリクス名を参照で き、二重管理を避けられる メトリクスの宣言→ダッシュボード作成まで自動化可能 © vdaas/vald 8
メリット メソッドチェーンで書けるので、補完に沿って書ける テキストなのでLLMの力を借りやすい GUIから出力できるJSONからGoへの自動変換が可能 © vdaas/vald 9
メリット 簡単にバージョンアップグレード 公式がAPIスキーマから自動生成しているので go get でタグを切り替えるだけで簡単に最新に追従できる 網羅性が高い go get github.com/grafana/grafana-foundation-sdk/
[email protected]
+cog-v0.0.x
© vdaas/vald 10
メリット 公式から promql もビルダーが提供されていて、複雑な文字列、括弧の対応の管理を 避けられる © vdaas/vald 11
注意点 grafana/grafana- foundation-sdk#673 パネル配置にバグが あるため 行や列の位置がズレ るなど 自分で整理するコー ドを書く必要あり 現状
puzzle.go としてVald レポジトリで公開 © vdaas/vald 12
結果 コード量を1万行近く削減 ほぼ同じボードを再現 © vdaas/vald 13
最新の取り組み 1. Grafana Foundation SDKを用いたGrafana Dashboard as Code 2. E2E
V2: YAMLで宣言的にテストシナリオを記述 © vdaas/vald 14
E2Eの悩み CRUDの処理がたくさんあるが、コードで書いていると冗長になりがち 違うコードベースに同じようなコードが散らばる データを取り出してアサートする流れも煩雑になりがち © vdaas/vald 15
E2E V2: YAMLで宣言的にテストシナリオを記 述 得られた成果 ジェネリクスを用いた汎用k8s, gRPCクライアント 別環境でもYAMLをもとにk8s JobでE2Eが走る パスで結果を取り出し、アサートできる
並列実行・Loop処理を用いた負荷試験 Future Work PBT: Property Based Testing © vdaas/vald 16
ベクトルDB選定のすすめ CNCFにはハイブリッドサーチをサポートするOpenSearchもあり、検索用途で 推薦・検出などベクトル検索だけ必要で、パフォーマンス重視の方にはValdは 検索手法 エンジン 90 %ile (ms) 99 %ile
(ms) MRR 全文検索 OpenSearch 10.42 23.79 0.605 ハイブリッド サーチ OpenSearch 21.56 28.823 0.661 ベクトル検索 OpenSearch 9.60 11.87 0.619 ベクトル検索 Vald 1.93 2.363 0.615 検索エンジン選定ガイド:ベクトル検索・全文検索からハイブリッドサーチまで LINEヤフー Tech Blog © vdaas/vald 17
Contributions are Welcome! vald.vdaas.org © vdaas/vald 18