Two-Tower モデルで実現する検索リランキング / Shibuya_AI_2

Two-Tower モデルで実現する  検索リランキング  渋谷 Biz × AI: ビジネスにおけるAI利活用事例勉強会, 2025.06.11 
    株式会社ビズリーチ（Visional グループ）  プロダクト本部プラットフォーム統括部データプロダクト部  検索基盤グループ  渡會恭平  1

渡會　恭平（わたらい　きょうへい）  2017.02 株式会社ビズリーチ入社  • AIグループに所属し、自然言語処理やレコメンド技術を用いたAI機能開発に従事  • 2024.08 に検索基盤グループに異動し、機械学習を用いた検索・ラ
ンキングの改善に従事    自己紹介  2

• 求職者検索  • リランキング  ◦ Two-Tower モデル  ◦ プロダクション適用に向けて  ◦
実験・評価  • まとめ  アジェンダ  3

求人を元に検索クエリを作成し、検索で候補者一覧（レジュメ一覧）を取得する    求職者検索  4 採用担当者 

検索は2つのステップを経て検索クエリから候補者一覧を取得する  1. フィルタリングによる候補者の絞り込み  2. スコアリングによる検索クエリと求職者の関連性の計算  求職者検索の流れ  5

検索  • ユーザーがプロダクトに問い合わせてアイテムを獲得する  • プロダクトに指示を与えるために、検索クエリを作成する  推薦  • プロダクトからユーザーに向けてアイテムを提案する  • プロダクトはユーザーの情報を元に、ユーザーに適切なアイテムを提供する 
        検索と推薦  6

検索タスクに取り組むために、以下のことを考慮する  1. 検索エンジンに問い合わせるクエリ作成  2. マッチングの組み合わせは「ユーザー × アイテム」ではなく「クエリ × アイテム」である  3.
クエリ情報と一致したアイテムではなく、ユーザーアクションを促すようなアイテムを提供する  検索の課題  7

適切な候補者を取得するためのクエリ作成が難しい  • 入力した条件が少なければ幅広く取得できるが、候補者一覧から求める人物を見つけるのが困難  • 入力した条件が細かければ、条件に一致する候補者が限られる（候補者を取得できないことがある）  例：「データサイエンティスト」を探す  検索の課題 1：クエリ作成  8 厳しい条件は候補者
  一覧を取得できない   粗い条件は、候補者を絞り込めない 

「ユーザー × アイテム」のマッチングではなく「クエリ × アイテム」のマッチングであることに注意する  • ユーザーが検索しているのでマッチングの組み合わせはユーザー × アイテムにみえるが、実際はクエリを介してユーザーが求めるアイテムを取得するため、クエリ
× アイテムになる  • 問題設計する際は、ユーザー・クエリ・アイテムの3要素を整理して施策を進めると良い  検索の課題 2：クエリとアイテムのマッチング  9 クエリを介して、  候補者一覧を取得する  

ユーザーアクションを促すような検索結果を提供するのが難しい  • クエリとアイテムの関連性だけでは、ビジネス指標には反映されづらい  • クエリに関連するアイテムだけではなく、ユーザーのアクションも含めてロジックを組むことが必要    検索の課題 3：ユーザーアクションへの影響  10 関連アイテムを取得しても検
索結果からアクションに繋がらない 

検索で取得した候補者一覧を、ユーザーのニーズにあわせた候補者一覧に修正して提供する  • 検索は、クエリと関連する候補者を取得する  • リランキングは、関連する候補者をユーザーごとに最適化する  例：検索＆リランキングのフロー  リランキング導入による課題解決  11

システム面で制約がある  • 検索全体の処理で約1秒以内に完了することが求められる  ◦ クエリ生成 → フィルタリング → スコアリング →
リランキング、と処理が多い  ◦ その中でも、リランキングはさらに短い時間で処理を完了させる必要があるため、軽量かつリアルタイム性が求められる  ◦ 言い換えれば、複雑＆重いモデルの採用は厳しい（採用する場合、コストがかかる）  リランキング導入にあたって注意すること  12

Two-Tower モデルを採用する  • Two-Tower モデルは、検索クエリと候補者のデータをそれぞれ扱う2つの Encoder（Tower）で構成  • 各 Tower で
Embeddings を生成し、定義した関数でクエリと候補者のスコアを計算  リランキングを実現する  13

Two-Tower モデル採用の決め手！  1. マルチモーダルに対応  ◦ テーブルデータに加え、ビズリーチにある豊富なレジュメ・求人のテキストデータなどを活用できる    2. 各 Tower
が独立しているので、プロダクション環境で分けて運用可能  ◦ 求職者のデータに対しては、データベースに格納する際に処理するため、重めのモデルを採用できる  ◦ 検索クエリに対しては、軽量なモデルを採用することでリアルタイム性を確保できる    3. コールドスタート問題に強い  ◦ 新規ユーザーに対しても適応できる    Two-Tower モデル  14

3つ要素技術を紹介  1. Deep Metric Learning  2. Negative Sampling  3. Multi-Modal 
Two-Tower モデルのテクニック  15

検索クエリとドキュメントのベクトルを生成したのち、距離関数に基づいてベクトル間の類似を学習する  • 検索クエリとドキュメントのペアに対して、類似するものは近くなるように、異なるものは遠くなるように Encoder （Tower）を学習する  • 距離計算やデータセットに応じて損失関数を設定する  Deep Metric Learning 
16 引用：https://www.mdpi.com/2073-8994/11/9/1066 

学習データセット作成に関するアプローチで、Negative Example 選択の戦略によって精度が大きく変わる  • Easy Negative が多い → 細かな判別が難しい  •
Hard Negative が多い → 偏りが生まれるため精度影響に懸念がある  Negative Sampling  17 引用：https://www.mdpi.com/2073-8994/11/9/1066 

複数の情報モダリティを統合して処理するアプローチ  • 検索リランキングでは、検索条件や求職者の属性値だけではなく、レジュメや行動履歴といった対象に紐付く情報を活用している  例  Multi-Modal  18

ビズリーチの求職者検索向けの改善に活用したテクニックを紹介します  今回は、検索クエリを対象にマルチモーダルのデータ作成の事例をお話しします    プロダクション適応に向けて  19

採用担当者の情報も考慮する  • 検索クエリのマルチモーダルの1つに採用担当者のモーダルを入れることを考える  • 採用担当者の情報からその人の好みを反映するため、ここでは行動履歴データから特徴を生成してモデルに導入し、精度改善を狙う  検索クエリのモーダル  20 採用担当者の属性値や、行動履歴  
から作成した特徴を利用する  

• 行列分解のアルゴリズムを用いて、企業と候補者のインタラクションの行列を因数分解し、それぞれベクトルを作成する  • イメージとしては、履歴が類似するユーザー・アイテムがほぼ同じ方向となるベクトルを計算する    行動履歴を用いた特徴の導入（1）  21

• 行列分解で得られたベクトルを各 Tower への入力の特徴として扱う  行動履歴を用いた特徴の導入（2）  22

リランキング導入でどれだけ効果があるかオフライン実験を行う  データ  • 学習データ：1ヶ月  • テストデータ：1週間  評価指標  • MAP@50  •
MRR@50  • NDCG@50  実験・評価  23

オフライン実験では、リランキングありの方が良いことがわかった              オンライン実験でも、リランキング導入で約1.5倍にインタラクションが増加した！  結果  24
評価指標ベースラインリランキング MRR@50 0.1643 0.1998 MAP@50 0.0537 0.1504 NDCG@50 0.3233 0.3505

• 求職者検索とリランキングの紹介  ◦ ユーザーのアクションを促すための機能開発    • Two-Tower モデルと精度改善に向けたテクニックを紹介  ◦ 要素技術の説明 
▪ Metric Learning  ▪ Negative Sampling  ▪ Multi-Modal  ◦ 精度改善施策の紹介とその実験・評価を紹介  まとめ  25

Appendix  26

Embedding-based Retrieval in Facebook Search  https://arxiv.org/pdf/2006.11632    Embedding-based Product Retrieval
Taobao Search  https://arxiv.org/pdf/2106.09297    Deep Metric Learning: A Survey  https://www.mdpi.com/2073-8994/11/9/1066      Appendix：参考文献  27

ビズリーチが提供する検索システムの1つに、採用企業様/ヘッドハンター様向けの求職者検索エンジンがある  Appendix：求職者検索システム  28

• Query Tower のモデルと Candidate Tower のモデルからベクトルを生成し、検索の過去ログのインタラクションを元にそれぞれのモデルを学習する  • リランキングでは
Contrastive Learning を採用している  ◦ 類似するものは近くに、異なるものは遠くにマッピングされるように学習する  Appendix：Two-Tower モデル：学習  引用：https://www.mdpi.com/2073-8994/11/9/1066  29 類似度スコア（インタラクション）をもとに loss を算出

• 推論時には各 Tower から生成されたベクトルをベクトル空間にマッピングする  • マッピングされたベクトルは、近傍探索でクエリのベクトルに近似する候補者を取得する  Appendix：Two-Tower モデル：推論・変換  30

学習フローと損失関数  Appendix：Deep Metric Learning  31 引用：https://www.mdpi.com/2073-8994/11/9/1066 

Two-Tower モデルで実現する検索リランキング / Shibuya_AI_2

Two-Tower モデルで実現する検索リランキング / Shibuya_AI_2

Visional Engineering ＆ Design

More Decks by Visional Engineering ＆ Design

Other Decks in Technology

Featured

Transcript

Two-Tower モデルで実現する  検索リランキング  渋谷 Biz × AI: ビジネスにおけるAI利活用事例勉強会, 2025.06.11

• 求職者検索  • リランキング  ◦ Two-Tower モデル  ◦ プロダクション適用に向けて  ◦

求人を元に検索クエリを作成し、検索で候補者一覧（レジュメ一覧）を取得する    求職者検索  4 採用担当者

検索は2つのステップを経て検索クエリから候補者一覧を取得する  1. フィルタリングによる候補者の絞り込み  2. スコアリングによる検索クエリと求職者の関連性の計算  求職者検索の流れ  5

検索タスクに取り組むために、以下のことを考慮する  1. 検索エンジンに問い合わせるクエリ作成  2. マッチングの組み合わせは「ユーザー × アイテム」ではなく「クエリ × アイテム」である  3.

システム面で制約がある  • 検索全体の処理で約1秒以内に完了することが求められる  ◦ クエリ生成 → フィルタリング → スコアリング →

Two-Tower モデルを採用する  • Two-Tower モデルは、検索クエリと候補者のデータをそれぞれ扱う2つの Encoder（Tower）で構成  • 各 Tower で

Two-Tower モデル採用の決め手！  1. マルチモーダルに対応  ◦ テーブルデータに加え、ビズリーチにある豊富なレジュメ・求人のテキストデータなどを活用できる    2. 各 Tower

3つ要素技術を紹介  1. Deep Metric Learning  2. Negative Sampling  3. Multi-Modal

学習データセット作成に関するアプローチで、Negative Example 選択の戦略によって精度が大きく変わる  • Easy Negative が多い → 細かな判別が難しい  •

複数の情報モダリティを統合して処理するアプローチ  • 検索リランキングでは、検索条件や求職者の属性値だけではなく、レジュメや行動履歴といった対象に紐付く情報を活用している  例  Multi-Modal  18

ビズリーチの求職者検索向けの改善に活用したテクニックを紹介します  今回は、検索クエリを対象にマルチモーダルのデータ作成の事例をお話しします    プロダクション適応に向けて  19

• 行列分解で得られたベクトルを各 Tower への入力の特徴として扱う  行動履歴を用いた特徴の導入（2）  22

リランキング導入でどれだけ効果があるかオフライン実験を行う  データ  • 学習データ：1ヶ月  • テストデータ：1週間  評価指標  • MAP@50  •

オフライン実験では、リランキングありの方が良いことがわかった              オンライン実験でも、リランキング導入で約1.5倍にインタラクションが増加した！  結果  24

• 求職者検索とリランキングの紹介  ◦ ユーザーのアクションを促すための機能開発    • Two-Tower モデルと精度改善に向けたテクニックを紹介  ◦ 要素技術の説明

Appendix  26

Embedding-based Retrieval in Facebook Search  https://arxiv.org/pdf/2006.11632    Embedding-based Product Retrieval

ビズリーチが提供する検索システムの1つに、採用企業様/ヘッドハンター様向けの求職者検索エンジンがある  Appendix：求職者検索システム  28

• Query Tower のモデルと Candidate Tower のモデルからベクトルを生成し、検索の過去ログのインタラクションを元にそれぞれのモデルを学習する  • リランキングでは

• 推論時には各 Tower から生成されたベクトルをベクトル空間にマッピングする  • マッピングされたベクトルは、近傍探索でクエリのベクトルに近似する候補者を取得する  Appendix：Two-Tower モデル：推論・変換  30

学習フローと損失関数  Appendix：Deep Metric Learning  31 引用：https://www.mdpi.com/2073-8994/11/9/1066

Two-Tower モデルで実現する 検索リランキング / Shibuya_AI_2

Two-Tower モデルで実現する 検索リランキング / Shibuya_AI_2

More Decks by Visional Engineering ＆ Design

Other Decks in Technology

Featured

Transcript

Two-Tower モデルで実現する検索リランキング / Shibuya_AI_2

Two-Tower モデルで実現する検索リランキング / Shibuya_AI_2