新規検索基盤でマッチング精度向上に挑む！～『ホットペッパーグルメ』の開発事例技術編

新規検索基盤でマッチング精度向上に挑む！～『ホットペッパーグルメ』の開発事例 RECRUIT TECH CONFERENCE 2025 技術編須藤遼介株式会社リクルート
プロダクトディベロップメント室

須藤遼介ゲーム・NBA観戦・ラーメン経歴 / Career 2019年にリクルートにキャリア採用入社。機械学習エンジニアとして各種領域を担当 2024年より飲食領域の検索基盤開発・ロジック開発を担当趣味
/ Hobbies データ推進室販促領域データソリューション３ユニット（飲食・ビューティー）飲食・ビューティーデータソリューション部飲食・ビューティーデータエンジニアリングG

新規検索基盤の構築

高速な仮説検証を実現する上での現行基盤の課題データ連携の各操作を行う際に連携が必要な組織が多い • インデックスへのデータ再連携は BatchTに依存する • 特徴量の追加のためにはデータ組織から横断検索基盤Tへデータの受
け渡しが必要実験のための工数が増大し仮説検証実施が遅れてしまうオンプレ基盤 Batchチーム横断検索基盤チームデータ組織データ投入事業DB 中間DB データ抽出データ・スキーマ更新依頼データ投入検索エンジン

新規検索基盤の目標 • データ組織主導による仮説検証の実施 ◦ 新規Mappingの設定 ◦ インデックスの再作成・複数運用 ◦ 特徴量の追加 •
検索システムへのMLモデルの導入 ◦ VectorSearch(Dense/Sparse) ◦ Hybrid Search ◦ Reranker データ組織データ投入スキーマ・ロジック変更検索エンジン店舗情報 0.4, 0.8, 0.1 0.6, 0.9, 0.5 0.3, 0.7, 0.2 検索クエリ 0.6, 0.9, 0.5 kNN 検索エンジン

Amazon OpenSearch Serviceの導入検索エンジンとしてOpenSearchを導入 • 現行のElastic Searchからの資産が活かせる ◦ SearchTemplate /
Index Mapping • 無停止アップグレードに対応 ◦ Blue/Green Deploy • マネージドのETLツールも用意 • 基本的なベクトル検索やHybrid Searchに対応 • AWSで構築された社内ML基盤との連携が容易社内のAWSで構築された API/Job基盤 Amazon OpenSearch Service Amazon OpenSearch Ingestion

Dynamo DBをマスタDB としたインデックス構築差分データの集約先としてDynamoDBを利用 OpenSearchIngestionを利用して OpenSearchとデータ連携マスタデータとしてDynamoDBを利用することでOpenSearchの再作成が容易 • Ingestion接続時からデータ連携開始
• 連携中に送られた差分データも随時連携設定更新のハードルが下がり仮説検証がしやすくなる差分データ新規インデックス設定付与接続したタイミングでデータ連携開始 index index 実験用 index 差分データ随時連携接続後の更新データも下流にそれぞれ連携

検索API: Query Proxy リクエストを処理するAPI MLモデルによる推論もここで実行 • Planner: 検索ロジックの判断 • QueryBuilder:
OSへのクエリ生成 • Executor: Queryの並列実行 • Aggregation: 結果の集約 API内でのRerankやHybridSearchに対応 OpenSearchの機能に制限されない柔軟なロジック構築が可能 Planner QueryBuilder Lexical Search QueryBuilder Vector Search Executor Lexical Search Results Vector Search Results Aggregation (RRF, Reranker) Results Query Amazon OpenSearch Service

実際に運用してみて • インデックスの再作成のハードルは非常に下がった ◦ Mappingの変更などは非常に簡単に行える • OpenSearchIngestionはかなりハマりポイントが多かった ◦ 更なるドキュメントの拡充を期待！ •
OpenSearchのベクトル検索機能は限定的 ◦ ベクトル検索の機能を外出しするのは必須の判断だったかも

検索ロジックの改善

ベクトル検索の投入 Two-Towerベースのモデル • クエリと店舗情報で異なる Encoderを用いる • クエリとドキュメントのペアによる対照学習従来ロジックよりクエリの揺らぎに強い検索ができる
東京　焼肉リクルートクラフトビールホルモン炎居酒屋リクルートビール三昧八重洲堂 1.0 1.0 1.0 0.0 0.0 0.0 0.0 0.0 0.0 ユーザクエリ東京焼き肉店舗情報店名/住所/メニュー… Query Encoder Document Encoder Query Embedding Document Embedding ペア Score クエリ店舗ペア同士のスコアが高くなるように学習

ベクトル検索導入の課題と対応策 OS上でのHybrid Search実現の諸々 Hybrid Searchの方が全体として高精度課題 (※OSで実施する上で) • Pagination非対応 •
スコアの統合機能が弱い対応策 API上で諸々実装 • TopN件のみHybrid Searchをして全文検索へフォールバックさせる • API上でスコアのマージを実装する OpenSearchの機能制約に制限されずロジック実現 Pagination非対応だが高精度なロジック Paginationに対応したロジック Planner QueryBuilder Lexical Search QueryBuilder Vector Search Executor Lexical Search Results Vector Search Results Aggregation (RRF, Reranker) Results Query ロジック間で重複が起きないように制御 1 N N+1

ロジック改善の結果初回ABの結果 • 検索経由でのCV数が+10%近く改善 • 0件ヒット率90%近く削減現在も継続的なABテストを実施中 ※検証中のため利用できるユーザは限定されています

まとめ基盤 • 設定変更・再構築のしやすい検索システムを構築 Open Search/Ingestion/DynamoDB • API上でHybridSearch/Rerankingを行うことでOSの制約にとらわれないロジックの実装に対応ロジック
• Two-Towerモデルを中心にしたベクトル検索ロジックを作成 • 各種精度向上の工夫により本番ABテストで10%近くのCV向上を実現

新規検索基盤でマッチング精度向上に挑む！～『ホットペッパーグルメ』の開発事例技術編

新規検索基盤でマッチング精度向上に挑む！～『ホットペッパーグルメ』の開発事例技術編

Recruit PRO

More Decks by Recruit

Other Decks in Technology

Featured

Transcript

新規検索基盤でマッチング精度向上に挑む！～『ホットペッパーグルメ』の開発事例 RECRUIT TECH CONFERENCE 2025 技術編須藤遼介株式会社リクルート

須藤遼介ゲーム・NBA観戦・ラーメン経歴 / Career 2019年にリクルートにキャリア採用入社。機械学習エンジニアとして各種領域を担当 2024年より飲食領域の検索基盤開発・ロジック開発を担当趣味

新規検索基盤の構築

新規検索基盤の目標 • データ組織主導による仮説検証の実施 ◦ 新規Mappingの設定 ◦ インデックスの再作成・複数運用 ◦ 特徴量の追加 •

Amazon OpenSearch Serviceの導入検索エンジンとしてOpenSearchを導入 • 現行のElastic Searchからの資産が活かせる ◦ SearchTemplate /

検索API: Query Proxy リクエストを処理するAPI MLモデルによる推論もここで実行 • Planner: 検索ロジックの判断 • QueryBuilder:

実際に運用してみて • インデックスの再作成のハードルは非常に下がった ◦ Mappingの変更などは非常に簡単に行える • OpenSearchIngestionはかなりハマりポイントが多かった ◦ 更なるドキュメントの拡充を期待！ •

検索ロジックの改善

ベクトル検索の投入 Two-Towerベースのモデル • クエリと店舗情報で異なる Encoderを用いる • クエリとドキュメントのペアによる対照学習従来ロジックよりクエリの揺らぎに強い検索ができる

ベクトル検索導入の課題と対応策 OS上でのHybrid Search実現の諸々 Hybrid Searchの方が全体として高精度課題 (※OSで実施する上で) • Pagination非対応 •

ロジック改善の結果初回ABの結果 • 検索経由でのCV数が+10%近く改善 • 0件ヒット率90%近く削減現在も継続的なABテストを実施中 ※検証中のため利用できるユーザは限定されています

まとめ基盤 • 設定変更・再構築のしやすい検索システムを構築 Open Search/Ingestion/DynamoDB • API上でHybridSearch/Rerankingを行うことでOSの制約にとらわれないロジックの実装に対応ロジック

新規検索基盤でマッチング精度向上に挑む！ ～『ホットペッパーグルメ』の開発事例 技術編

新規検索基盤でマッチング精度向上に挑む！ ～『ホットペッパーグルメ』の開発事例 技術編

More Decks by Recruit

Other Decks in Technology

Featured

Transcript

新規検索基盤でマッチング精度向上に挑む！～『ホットペッパーグルメ』の開発事例技術編

新規検索基盤でマッチング精度向上に挑む！～『ホットペッパーグルメ』の開発事例技術編