Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Voyagerを利用した宿画像の最近傍探索による候補生成
Search
Yudai Hayashi
January 20, 2024
1
250
Voyagerを利用した宿画像の最近傍探索による候補生成
Yudai Hayashi
January 20, 2024
Tweet
Share
More Decks by Yudai Hayashi
See All by Yudai Hayashi
MCP Clientを活用するための設計と実装上の工夫
yudai00
1
790
人とシゴトのマッチングを実現するための機械学習技術
yudai00
1
12
MCPを理解する
yudai00
16
11k
データバリデーションによるFeature Storeデータ品質の担保
yudai00
1
110
「仮説行動」で学んだ、仮説を深め ていくための方法
yudai00
7
1.8k
相互推薦システムでのPseudo Label を活用したマッチ予測精度向上の取り組み
yudai00
1
830
Wantedly Visitにおけるフリーワード検索時の推薦のオンライン化事例紹介
yudai00
1
230
RustとPyTorchで作る推論サーバー
yudai00
12
7.2k
BigQueryで作る簡単なFeature Store
yudai00
2
370
Featured
See All Featured
Designing Experiences People Love
moore
142
24k
Building Applications with DynamoDB
mza
95
6.4k
How to train your dragon (web standard)
notwaldorf
92
6k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2.1k
For a Future-Friendly Web
brad_frost
178
9.7k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
15
890
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Raft: Consensus for Rubyists
vanstee
137
7k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
840
Large-scale JavaScript Application Architecture
addyosmani
512
110k
Transcript
© 2024 Wantedly, Inc. Voyagerを利用した宿画像の最近傍 探索による候補生成 atmaCup振り返り会LT Jan. 20 2024
- Yudai Hayashi
© 2024 Wantedly, Inc. INTERNAL ONLY 自己紹介 林 悠大 • 経歴:
◦ 東京大学工学系研究科でPh.D取得 ◦ 2022年にウォンテッドリーにデータサイ エンティストとして新卒入社。推薦シス テムの開発を行う • X: @python_walker • 趣味: ◦ 読書 ◦ 音楽聴くこと ◦ ウイスキー
© 2024 Wantedly, Inc. INTERNAL ONLY 今日話すこと • 宿画像のembeddingとVoyagerを組み合わせて候補生成に活用する アイデア
• どれくらいうまくいくのか
© 2024 Wantedly, Inc. INTERNAL ONLY Spotifyが開発している近似最近傍探索ライブラリVoyager https://spotify.github.io/voyager/python/reference.html
© 2024 Wantedly, Inc. INTERNAL ONLY 画像が似ている宿の抽出 アイデア:セッションで見ている宿と似たような部屋の宿が予約される? インデックス作成 候補生成
スライド1枚に収まる分量で候補生成ができる
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:インデックス作成 検索に必要な情報をまとめて 持っておく
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:検索 • セッションの最後の宿と 県を渡して検索
• Recall@20 = 0.06 • 県の人気宿を取ってく るとRecall@20 = 0.25 • 検索にかかる時間は 30秒くらい
© 2024 Wantedly, Inc. INTERNAL ONLY まとめ • 宿画像のembeddingをVoyagerと組み合わせて候補生成を行う手法を紹介 •
簡単な実験結果の共有