Upgrade to Pro — share decks privately, control downloads, hide ads and more …

双方向推薦システムにおける長期的マッチング最大化に向けた代理目的関数の設計と実証

 双方向推薦システムにおける長期的マッチング最大化に向けた代理目的関数の設計と実証

2026/6/12に、2026年度 人工知能学会全国大会(第40回)で発表した西村の資料になります。

Avatar for Recruit

Recruit PRO

June 17, 2026

More Decks by Recruit

Other Decks in Technology

Transcript

  1. © Recruit Co., Ltd. All Rights Reserved 双方向推薦システムにおける 長期的マッチング最大化に向けた 代理目的関数の設計と実証

    株式会社リクルート 西村 直樹 東京科学大学 小林 健 東京科学大学 中田 和秀 2026年度人工知能学会全国大会(第40回) 2026年6月12日 @ Gメッセ群馬
  2. © Recruit Co., Ltd. All Rights Reserved 2 発表の構成 ⚫

    背景と課題 ⚫ 長期的マッチングを考慮した代理目的変数 ⚫ 将来マッチング率の推定の安定化 ⚫ 数値実験 ⚫ まとめと今後の課題
  3. © Recruit Co., Ltd. All Rights Reserved 3 双方向推薦システム 推薦する側、推薦される側の両者の嗜好を加味して推薦対象を決定

    例:求人検索プラットフォーム → 求職者と企業(求人票)の両者を考慮した推薦が求められる 求職者 企業 考慮度合い 求職者行動 企業行動 考慮度合い 求職者 企業 求職者行動 企業行動
  4. © Recruit Co., Ltd. All Rights Reserved 4 課題 1度の推薦でのマッチング度合いは最大化されるが、

    求職者が行動を起こすことによる長期的な影響が考慮されない 双方向推薦システムの目的関数と課題 推薦の目的関数として、双方向の両者のスコアの積が一般的に用いられる [Pizzato+ 2010] 求職者 企業 閲覧・応募などの 求職者行動の度合い 選考通過・内定など の企業行動の度合い 求職者の行動意欲が低下してサービスから早期に離脱したり、推薦の 情報源となる行動データが減少することにより推薦精度が低下
  5. © Recruit Co., Ltd. All Rights Reserved 5 課題 のように指数重み

    を動的に決めれば よさそうだが、ルールベースの設定では最終指標の向上が難しい 求人検索プラットフォームにおける理想的な推薦の挙動 登録初期や離反期の活動意欲が十分でない段階では、直接マッチングに 繋がる求人に加えて、選択肢を広げる求人もあわせて提示し求職活動の活性化 序盤 定着期 離反期 方針 重視指標 まず求職活動の 開始を支援する 行動データをもとに マッチングしやすい 求人を推薦 活動意欲を再度 喚起する 求職者行動重視 マッチング重視 求職者行動重視
  6. © Recruit Co., Ltd. All Rights Reserved 6 関連研究と提案手法の位置づけ 双方向推薦の標準的な定式化

    [Pizzato+ 2010] • 双方向の両者の受容スコアの積による貪欲最適化 → 目先のマッチング率に偏る最適化で、将来価値を考慮しない ベルマン方程式の近似に基づく代理目的関数の設計 [Cai+ 2023] • ベルマン方程式の一次近似(即時報酬+将来価値増分)を代理目的関数に用いる • 価値関数の学習が過去データだけでは閉じず、オンライン更新を前提とする → 安定的な運用が求められるサービスへの適用が難しい 提案手法 • Cai+の代理目的関数(即時報酬+将来価値増分)の枠組みは共通 • 将来価値の増分を過去データを用いて推定 → オンライン更新不要 • ドメイン知識を利用した形状制約付き回帰 → スパースデータでも推定を安定化
  7. © Recruit Co., Ltd. All Rights Reserved 7 発表の構成 ⚫

    背景と課題 ⚫ 長期的マッチングを考慮した代理目的変数 ⚫ 将来マッチング率の推定の安定化 ⚫ 数値実験 ⚫ まとめと今後の課題
  8. © Recruit Co., Ltd. All Rights Reserved 8 が大のとき求職者行動重視、 が小のときマッチング

    重視となるような代理目的関数を設計したい 離反期 求職者状態に合わせた推薦の実現のための準備 求職者行動数 (Frequency)、最終行動からの経過日数 (Recency) のシンプルな 2次元空間で求職者状態を定義したときの将来のマッチング率を観察 序盤:求職者行動が生じることによる将来マッチング率 の増分 が大きい 定着期:求職者行動が増えると追加で行動が生じること による は低減 離反期:最終行動から経過日数が経っていくと、将来 マッチング率が低下していくため、新たに行動が生じた ときの は再度大きくなる 求職者状態ごとの 将来のマッチング率 定着期 序盤
  9. © Recruit Co., Ltd. All Rights Reserved 9 求職者状態ごとの 将来のマッチング率

    提案する代理目的関数 その推薦による直接的なマッチング度合いを測るスコアの積に加えて、 求職者行動が生じることによる将来のマッチング率増分 も考慮し順序付け 求職者行動が生じることによる 将来マッチング率の増分 将来効果の 重視度パラメータ 求職者 の の具体的な算出例: ① 求職者行動数0、経過日数10、将来マッチング率 0.1 ↓求職者行動が生じることによる状態変化 ② 求職者行動数1, 経過日数0:将来マッチング率 0.2 ① ②
  10. © Recruit Co., Ltd. All Rights Reserved 10 求職者状態ごとの将来のマッチング率 提案する代理目的関数による推薦の挙動

    小 → 従来の貪欲最適の目的関数に近い 大 → の影響が相対的に大 離反期 小 大 定着期 序盤 大 を対象プラットフォームの行動ログから集計、 を実験をもとに適切にに設定することで、推薦を動的に調整可能に
  11. © Recruit Co., Ltd. All Rights Reserved 11 発表の構成 ⚫

    背景と課題 ⚫ 長期的マッチングを考慮した代理目的変数 ⚫ 将来マッチング率の推定の安定化 ⚫ 数値実験 ⚫ まとめと今後の課題
  12. © Recruit Co., Ltd. All Rights Reserved 12 求職者状態ごとの将来マッチング率の推定の課題 将来マッチング率の推定において、マッチング数は

    求職者行動数に比べてサンプルサイズが小さい → 累積行動数 (Frequency) と経過日数 (Recency) の組によってはデータがスパースとなり推定が不安定に 将来マッチング率について、ドメイン知識として 期待される、以下の性質を満たすように補正する • 累積行動数が多い → 将来マッチング率 大 • 行動からの経過日数が長い → 将来マッチング率 小 実績平均の将来マッチング率 最終行動からの経過日数 が長いほど低下
  13. © Recruit Co., Ltd. All Rights Reserved 13 単調性制約によるマッチング率表の補正 累計行動数

    が大きいほど推定値は大 サンプルサイズ 集計値 推定値 実績平均の将来マッチング率 推定の将来マッチング率 最終行動からの経過日数 が長いほど低下 経過日数 が大きいほど推定値は小 について常に正の値を取る ことが保証される [Iwanaga+ 2016]
  14. © Recruit Co., Ltd. All Rights Reserved 14 発表の構成 ⚫

    背景と課題 ⚫ 長期的マッチングを考慮した代理目的変数 ⚫ 将来マッチング率の推定の安定化 ⚫ 数値実験 ⚫ まとめと今後の課題
  15. © Recruit Co., Ltd. All Rights Reserved 15 人工データによる検証 ―

    実験設定 • 求職者行動による将来マッチング率の変化度合いを2パターンの仮定で設定 - 動的環境(変化あり) → 求職者行動の有無により次の推薦の がそれぞれ増減 - 静的環境(変化無し) → 求職者行動が次の推薦の に影響しない 静的環境の将来マッチング率 動的環境の将来マッチング率 求職者行動が増 → 対数関数的にマッチング率増 経過ステップ増 → 指数関数的にマッチング率減 • 求職者と企業の行動確率は既知として、一様分布U(0, 0.3)から独立にサンプリング • 50期後の累積の求職者行動数、マッチング数を 貪欲/提案 目的関数をもとに推薦した場合で比較 実験設定詳細:https//www.github.com/nnnnishi/contrast-effect-jsai2026
  16. © Recruit Co., Ltd. All Rights Reserved 16 • 行動により活動意欲に変化がない状況では、提案目的関数による推薦は

    求職者行動を増加させるものの最終的なマッチング数は減少 • 現実に近い、行動により活動意欲が変化する状況では、提案目的関数にて適切に を設定することで求職者行動だけでなくマッチングまで増加 実験結果 静的環境 求職者行動を重視 するとマッチングが減 動的環境 求職者行動を適度に重視 するとマッチングが増 • 実サービスでのA/Bテストにおいても、動的環境と同様の傾向を確認
  17. © Recruit Co., Ltd. All Rights Reserved 17 発表の構成 ⚫

    背景と課題 ⚫ 長期的マッチングを考慮した代理目的変数 ⚫ 将来マッチング率の推定の安定化 ⚫ 数値実験 ⚫ まとめと今後の課題
  18. © Recruit Co., Ltd. All Rights Reserved 18 まとめと今後の課題 まとめ

    • 長期的なマッチング増加のため、短期的なマッチング率と 将来のマッチング率増分を組み合わせた代理目的関数を提案 • 将来マッチング率の推定において、単調性制約を課した 凸二次計画問題としてモデリングすることで安定した推定を実現 今後の課題 • 将来効果の重視度パラメータ のパーソナライズ → どの程度将来効果を重視すべきかはユーザによって異なる • 推薦方策の変化を考慮した将来マッチング率増分の推定 → 方策変化を反映しつつ、安定運用が可能な方法を検討