双方向推薦システムにおける長期的マッチング最大化に向けた代理目的関数の設計と実証

© Recruit Co., Ltd. All Rights Reserved 双方向推薦システムにおける長期的マッチング最大化に向けた代理目的関数の設計と実証
株式会社リクルート西村直樹東京科学大学小林健東京科学大学中田和秀 2026年度人工知能学会全国大会（第40回） 2026年6月12日 @ Gメッセ群馬

© Recruit Co., Ltd. All Rights Reserved 2 発表の構成 ⚫
背景と課題 ⚫ 長期的マッチングを考慮した代理目的変数 ⚫ 将来マッチング率の推定の安定化 ⚫ 数値実験 ⚫ まとめと今後の課題

© Recruit Co., Ltd. All Rights Reserved 3 双方向推薦システム推薦する側、推薦される側の両者の嗜好を加味して推薦対象を決定
例：求人検索プラットフォーム → 求職者と企業（求人票）の両者を考慮した推薦が求められる求職者企業考慮度合い求職者行動企業行動考慮度合い求職者企業求職者行動企業行動

© Recruit Co., Ltd. All Rights Reserved 4 課題 1度の推薦でのマッチング度合いは最大化されるが、
求職者が行動を起こすことによる長期的な影響が考慮されない双方向推薦システムの目的関数と課題推薦の目的関数として、双方向の両者のスコアの積が一般的に用いられる [Pizzato+ 2010] 求職者企業閲覧・応募などの求職者行動の度合い選考通過・内定などの企業行動の度合い求職者の行動意欲が低下してサービスから早期に離脱したり、推薦の情報源となる行動データが減少することにより推薦精度が低下

© Recruit Co., Ltd. All Rights Reserved 5 課題のように指数重み
を動的に決めればよさそうだが、ルールベースの設定では最終指標の向上が難しい求人検索プラットフォームにおける理想的な推薦の挙動登録初期や離反期の活動意欲が十分でない段階では、直接マッチングに繋がる求人に加えて、選択肢を広げる求人もあわせて提示し求職活動の活性化序盤定着期離反期方針重視指標まず求職活動の開始を支援する行動データをもとにマッチングしやすい求人を推薦活動意欲を再度喚起する求職者行動重視マッチング重視求職者行動重視

© Recruit Co., Ltd. All Rights Reserved 6 関連研究と提案手法の位置づけ双方向推薦の標準的な定式化
[Pizzato+ 2010] • 双方向の両者の受容スコアの積による貪欲最適化 → 目先のマッチング率に偏る最適化で、将来価値を考慮しないベルマン方程式の近似に基づく代理目的関数の設計 [Cai+ 2023] • ベルマン方程式の一次近似（即時報酬＋将来価値増分）を代理目的関数に用いる • 価値関数の学習が過去データだけでは閉じず、オンライン更新を前提とする → 安定的な運用が求められるサービスへの適用が難しい提案手法 • Cai+の代理目的関数（即時報酬＋将来価値増分）の枠組みは共通 • 将来価値の増分を過去データを用いて推定 → オンライン更新不要 • ドメイン知識を利用した形状制約付き回帰 → スパースデータでも推定を安定化

© Recruit Co., Ltd. All Rights Reserved 8 が大のとき求職者行動重視、が小のときマッチング
重視となるような代理目的関数を設計したい離反期求職者状態に合わせた推薦の実現のための準備求職者行動数 (Frequency)、最終行動からの経過日数 (Recency) のシンプルな 2次元空間で求職者状態を定義したときの将来のマッチング率を観察序盤：求職者行動が生じることによる将来マッチング率の増分が大きい定着期：求職者行動が増えると追加で行動が生じることによるは低減離反期：最終行動から経過日数が経っていくと、将来マッチング率が低下していくため、新たに行動が生じたときのは再度大きくなる求職者状態ごとの将来のマッチング率定着期序盤

© Recruit Co., Ltd. All Rights Reserved 9 求職者状態ごとの将来のマッチング率
提案する代理目的関数その推薦による直接的なマッチング度合いを測るスコアの積に加えて、求職者行動が生じることによる将来のマッチング率増分も考慮し順序付け求職者行動が生じることによる将来マッチング率の増分将来効果の重視度パラメータ求職者のの具体的な算出例: ① 求職者行動数0、経過日数10、将来マッチング率 0.1 ↓求職者行動が生じることによる状態変化 ② 求職者行動数1, 経過日数0：将来マッチング率 0.2 ① ②

© Recruit Co., Ltd. All Rights Reserved 10 求職者状態ごとの将来のマッチング率提案する代理目的関数による推薦の挙動
小 → 従来の貪欲最適の目的関数に近い大 → の影響が相対的に大離反期小大定着期序盤大を対象プラットフォームの行動ログから集計、を実験をもとに適切にに設定することで、推薦を動的に調整可能に

© Recruit Co., Ltd. All Rights Reserved 12 求職者状態ごとの将来マッチング率の推定の課題将来マッチング率の推定において、マッチング数は
求職者行動数に比べてサンプルサイズが小さい → 累積行動数 (Frequency) と経過日数 (Recency) の組によってはデータがスパースとなり推定が不安定に将来マッチング率について、ドメイン知識として期待される、以下の性質を満たすように補正する • 累積行動数が多い → 将来マッチング率大 • 行動からの経過日数が長い → 将来マッチング率小実績平均の将来マッチング率最終行動からの経過日数が長いほど低下

© Recruit Co., Ltd. All Rights Reserved 15 人工データによる検証 ―
実験設定 • 求職者行動による将来マッチング率の変化度合いを2パターンの仮定で設定 - 動的環境（変化あり） → 求職者行動の有無により次の推薦のがそれぞれ増減 - 静的環境（変化無し） → 求職者行動が次の推薦のに影響しない静的環境の将来マッチング率動的環境の将来マッチング率求職者行動が増 → 対数関数的にマッチング率増経過ステップ増 → 指数関数的にマッチング率減 • 求職者と企業の行動確率は既知として、一様分布U(0, 0.3)から独立にサンプリング • 50期後の累積の求職者行動数、マッチング数を貪欲/提案目的関数をもとに推薦した場合で比較実験設定詳細：https//www.github.com/nnnnishi/contrast-effect-jsai2026

© Recruit Co., Ltd. All Rights Reserved 16 • 行動により活動意欲に変化がない状況では、提案目的関数による推薦は
求職者行動を増加させるものの最終的なマッチング数は減少 • 現実に近い、行動により活動意欲が変化する状況では、提案目的関数にて適切にを設定することで求職者行動だけでなくマッチングまで増加実験結果静的環境求職者行動を重視するとマッチングが減動的環境求職者行動を適度に重視するとマッチングが増 • 実サービスでのA/Bテストにおいても、動的環境と同様の傾向を確認

© Recruit Co., Ltd. All Rights Reserved 18 まとめと今後の課題まとめ
• 長期的なマッチング増加のため、短期的なマッチング率と将来のマッチング率増分を組み合わせた代理目的関数を提案 • 将来マッチング率の推定において、単調性制約を課した凸二次計画問題としてモデリングすることで安定した推定を実現今後の課題 • 将来効果の重視度パラメータのパーソナライズ → どの程度将来効果を重視すべきかはユーザによって異なる • 推薦方策の変化を考慮した将来マッチング率増分の推定 → 方策変化を反映しつつ、安定運用が可能な方法を検討

双方向推薦システムにおける長期的マッチング最大化に向けた代理目的関数の設計と実証

双方向推薦システムにおける長期的マッチング最大化に向けた代理目的関数の設計と実証

Recruit PRO

More Decks by Recruit

Other Decks in Technology

Featured

Transcript

© Recruit Co., Ltd. All Rights Reserved 双方向推薦システムにおける長期的マッチング最大化に向けた代理目的関数の設計と実証

© Recruit Co., Ltd. All Rights Reserved 2 発表の構成 ⚫

© Recruit Co., Ltd. All Rights Reserved 3 双方向推薦システム推薦する側、推薦される側の両者の嗜好を加味して推薦対象を決定

© Recruit Co., Ltd. All Rights Reserved 4 課題 1度の推薦でのマッチング度合いは最大化されるが、

© Recruit Co., Ltd. All Rights Reserved 5 課題のように指数重み

© Recruit Co., Ltd. All Rights Reserved 6 関連研究と提案手法の位置づけ双方向推薦の標準的な定式化

© Recruit Co., Ltd. All Rights Reserved 7 発表の構成 ⚫

© Recruit Co., Ltd. All Rights Reserved 8 が大のとき求職者行動重視、が小のときマッチング

© Recruit Co., Ltd. All Rights Reserved 9 求職者状態ごとの将来のマッチング率

© Recruit Co., Ltd. All Rights Reserved 10 求職者状態ごとの将来のマッチング率提案する代理目的関数による推薦の挙動

© Recruit Co., Ltd. All Rights Reserved 11 発表の構成 ⚫

© Recruit Co., Ltd. All Rights Reserved 12 求職者状態ごとの将来マッチング率の推定の課題将来マッチング率の推定において、マッチング数は

© Recruit Co., Ltd. All Rights Reserved 13 単調性制約によるマッチング率表の補正累計行動数

© Recruit Co., Ltd. All Rights Reserved 14 発表の構成 ⚫

© Recruit Co., Ltd. All Rights Reserved 15 人工データによる検証 ―

© Recruit Co., Ltd. All Rights Reserved 16 • 行動により活動意欲に変化がない状況では、提案目的関数による推薦は

© Recruit Co., Ltd. All Rights Reserved 17 発表の構成 ⚫

© Recruit Co., Ltd. All Rights Reserved 18 まとめと今後の課題まとめ