Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
10Xの検索を10xしたい at 【10X/M3/CADDi】検索エンジン運用勉強会
Search
Ryusuke Chiba
August 18, 2022
Programming
1.5k
5
Share
10Xの検索を10xしたい at 【10X/M3/CADDi】検索エンジン運用勉強会
「【10X/M3/CADDi】検索エンジン運用勉強会」での発表で利用した資料です
Ryusuke Chiba
August 18, 2022
More Decks by Ryusuke Chiba
See All by Ryusuke Chiba
10Xの検索を10xしたい at 第49回Elasticsearch勉強会
metalunk
0
560
プログラマのための線形代数 おまけ
metalunk
1
180
メルカリにおける AI 活用事例 PyCon JP 2018
metalunk
8
7k
メルカリの機械学習基盤 これまでとこれから ML Ops Study #2
metalunk
0
930
機械学習によるマーケット健全化 Mercari ML Ops Night #1
metalunk
3
5.5k
Other Decks in Programming
See All in Programming
継続的な負荷検証を目指して
pyama86
0
170
WebAssembly を読み込むベストプラクティス 2026年春版 / Best Practices for Loading WebAssembly (Spring 2026)
petamoriken
5
1k
t *testing.T は どこからやってくるの?
otakakot
1
900
2026年のソフトウェア開発を考える(2026/05版) / Software Engineering Scrum Fest Niigata 2026 Edition
twada
PRO
21
10k
過去のレビュー知見をSkillsで資産化した話
pkshadeck
PRO
1
1.1k
ソフトウェア設計の結合バランス #phperkaigi
kajitack
0
490
ハーネスエンジニアリングとは?
kinopeee
13
6.7k
PicoRuby for IoT: Connecting to the Cloud with MQTT
yuuu
2
750
JAWS-UG横浜 #100 祝・第100回スペシャルAWS は VPC レスの時代へ
maroon1st
0
210
実用!Hono RPC2026
yodaka
2
300
【26新卒研修資料】TDD実装演習
dip_tech
PRO
0
160
PHPでローカル環境用のSSL/TLS証明書を発行することはできるのか? #phpconkagawa
akase244
0
320
Featured
See All Featured
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.6k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
1k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
Context Engineering - Making Every Token Count
addyosmani
9
860
A Tale of Four Properties
chriscoyier
163
24k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
360
Art, The Web, and Tiny UX
lynnandtonic
304
21k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Building Flexible Design Systems
yeseniaperezcruz
330
40k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
680
How to make the Groovebox
asonas
2
2.2k
Transcript
©10X, Inc. All Rights Reserved. 【10X/M3/CADDi】検索エンジン運用勉強会 #Search_C10Xm3 10Xの検索を10xしたい @metalunk 1
©10X, Inc. All Rights Reserved. 2 10X が提供する Stailer の説明
チェーンストアECの垂直立ち上げプラットフォーム
©10X, Inc. All Rights Reserved. チェーンストアECの垂直立ち上げプラットフォーム Stailer 3 スーパーマーケットやドラッグストアの E-commerce
アプリ制作からオペレーションまで(詳しくは次のページ) インテグレータでなくプラットフォーム https://yamotty.tokyo/post/20220605 Smart retailer
©10X, Inc. All Rights Reserved. チェーンストアECの垂直立ち上げプラットフォーム Stailer 4
©10X, Inc. All Rights Reserved. 5 半年間で実施した検索改善
©10X, Inc. All Rights Reserved. 半年間で実施した検索改善 2022年1月からの半年間で取り組んだこと • Slow
query の解決(検索速度 10x) • Hardware profile の変更(コスト 80% 削減) • 検索キーワードサジェスト • カテゴリフィルタ • bigram • シノニム辞書を Search time に展開 • イベントログからシノニムルールの生成 今日は青字の部分だけ説明します 6 詳しくは https://product.10x.co.jp/entry/serch-10x https://product.10x.co.jp/entry/search-10x-ii
©10X, Inc. All Rights Reserved. Slow query の解決(検索速度 10x) 解決したい問題
• 張り付く CPU usage • 遅いレスポンス 7 半年間で実施した検索改善 リクエスト増,データ増に伴い増えるコスト
©10X, Inc. All Rights Reserved. Slow query の解決(検索速度 10x) やったこと
• Slow query log を出し,集計 • 遅いクエリを Search Profiler で解析 • クエリを改善する手段を考え,dev で実験 • リリース という ISUCON(今年は予選突破なりませんでした) 8 半年間で実施した検索改善
©10X, Inc. All Rights Reserved. Slow query の解決(検索速度 10x) 結論:
Elasticsearch が自動 mapping してくれた field に問題があった 1. siteType (パートナーの ID) を long 型で保管していた 2. siteType はほとんど全てのクエリで絞り込み条件に使うから,これが遅いとみんな遅い 3. long 型の絞り込みは PointInSetQuery で,木構造だろうからおそらく検索時の時間計算量は O(logN) 4. ドメイン知識を使うと siteType は enum であることがわかる 5. keyword 型にして InvertedIndex を作ると検索時の時間計算量は O(1) 9
©10X, Inc. All Rights Reserved. Slow query の解決(検索速度 10x) 10
半年間で実施した検索改善
©10X, Inc. All Rights Reserved. 検索キーワードサジェスト 解決したい問題 • Zero match
検索が多い やったこと • お客さまを良いキーワードに誘導し,Zero match 検索を減らす(Recall の向上) 11 半年間で実施した検索改善
©10X, Inc. All Rights Reserved. 検索キーワードサジェスト 12 半年間で実施した検索改善
©10X, Inc. All Rights Reserved. 検索キーワードサジェスト 結果 • 12.7% のゼロマッチ検索を削減した
• 検索が使いやすくなった 13 半年間で実施した検索改善
©10X, Inc. All Rights Reserved. 14 2022年1月からの半年間で取り組んだこと • Slow
query の解決(検索速度 10x) • Hardware profile の変更(コスト 80% 削減) • 検索キーワードサジェスト • カテゴリフィルタ • bigram • シノニム辞書を Search time に展開 • イベントログからシノニムルールの生成 今日発表できなかった改善事例は 8/31 の「第49回Elasticsearch勉強会」で発表する予定です https://www.meetup.com/ja-JP/tokyo-elastic-fantastics/events/287299123/
©10X, Inc. All Rights Reserved. 15 いま取り組んでいる推薦
©10X, Inc. All Rights Reserved. いま取り組んでいる推薦 Stailer における商品の Discovery のうち,お客さまが能動的に探す検索はまあまあいい状態になっ
てきたから,次はお客さまに受動的に商品を見つけてもらいたい 16 • 初期リリースでは MLOps 部分をきっちり作り,モデルは簡単なもの(ε-greedy のバンディッ ト)を出す • MLOps を @metalunk, Data science を Growth チームの2人で担当 • 出したらまたどこかで発表します 推薦やるぞ!
©10X, Inc. All Rights Reserved. 17 10X のすゝめ
©10X, Inc. All Rights Reserved. 10X のいいところ10個あげます 1. メンバーが賢い.自律的 2.
心理的安全性が高い(Brilliant jerk がいない) 3. 経営陣が信頼できる 4. SO に夢が持てる 5. スタートアップなのにまあまあ高い給与水準 6. Stailer を作ることで世界をよくできる 7. 事業が成長している 8. 日本のどこに住んでもいい 9. フルリモート OK 10. 家族第一 18
©10X, Inc. All Rights Reserved. カジュアル面談しませんか? この通り,検索はまだ基本的なことしかやっておらず,やることはたくさんあります 検索エンジニアが入社したら活躍できる状態を作りました
どんな人に来てほしい? • Stailer の検索を 10x できる人 • 検索,推薦合わせて Discovery という大きい Issue をまるっとやるのも大歓迎 Job description はこちら: https://open.talentio.com/r/1/c/10x/pages/59532 まずはカジュアル面談お願いします!: https://meety.net/matches/VKrfjFMdjWsC 19