Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Transformerを用いたアイテム間の 相互影響を考慮したレコメンドリスト生成

Transformerを用いたアイテム間の 相互影響を考慮したレコメンドリスト生成

2025/05/29に、人工知能学会全国大会で発表した、池田、濱田、高橋の資料です。

Avatar for Recruit

Recruit

July 13, 2025
Tweet

More Decks by Recruit

Other Decks in Technology

Transcript

  1. 株式会社リクルート データテクノロジーラボ 
 
 *池田柳之介 濱田賢吾 高橋 諒 
 
 2025年5月29日 


    人工知能学会全国大会@グランキューブ大阪 
 [3E1-GS-10] AI応用:製造 
 Transformerを用いたアイテム間の
 相互影響を考慮したレコメンドリスト生成 1
  2. 背景:一般的なレコメンドモデル ユーザごとに所与の数のアイテムを事前に選択し ,ユーザの訪問に対してそれらをリ スト形式で表出するレコメンドシステムを想定する - 上記において、以下のようなアルゴリズムがよく用いられる 1. ユーザの各アイテムに対する嗜好度を 個別にスコアリング 2.

    得られたスコアの降順でアイテムを推薦 アイテムD 
 3 アイテムA: 0.2 アイテムB: 0.4 アイテムC: 0.1 アイテムD: 0.5 アイテムE: 0.3 予測を行ったアイテムごとの 
 嗜好度/クリック率/コンバージョン率 
 アイテムB 
 アイテムE 
 アイテムA 
 スコアの降順でアイテムを推薦 

  3. 背景:同時に推薦されるアイテム同士の相互影響 同時に推薦されるアイテム同士は ,相互に影響を与えると考えるのが自然 - =ユーザは推薦されたアイテム同士を比較しながら行動する - → 同一のアイテムを推薦する場合でも、同時に推薦するアイテムによって購買意欲等が変化 すると考えられる 例)囮効果[1]、需要の食い合い

    5 S M L ¥100 ¥140 ¥150 購買を促進 S L ¥100 ¥150 囮になるような商品を同時に並べることに よって特定商品の購買を促進する 囮 アイテム個別のスコアリングでは、このような相互影響を考慮できない [1]Mousavi, N., Adamopoulos, P. and Bockst- edt, J.: The Decoy Effect and Recommendation Systems. Information Systems Research, 34(4), 1533– 1553 (2023).
  4. 関連研究レビュー 6 レコメンドリスト全体を考慮した推薦を行う「バンドル推薦」が提案されている Shalom et al. (2016) [2] - リスト内のアイテム同士の類似度を特徴量として活用する二段階学習法を提案

    → 候補アイテム間の相互影響が一定考慮可能 Gong et al. (2019) [3] - Graph Attention Network(GAttN) と Recurrent Neural Network(RNN)を組み合わせ、 候補アイテム間の関係性を考慮しながら動的にレコメンドリストを生成する手法を提案 → 推薦候補の全アイテムで捉えた関係性を考慮したリスト生成が可能 [2] Shalom, O.S., Koenigstein, N., Paquet, U. and Vanchinathan, H.P.: Beyond Collaborative Filtering: The List Recommendation Problem. In proceedings of the 25th International Conference on World Wide Web, 63–72 (2016). [3] Gong, Y., Zhu, Y., Duan, L., Liu, Q., Guan, Z., Sun, F., Ou, W. and Zhu, K.Q.: Exact-k recommendation via maximal clique optimization. In proceedings of the 25th ACM SIGKDD international conference on knowledge discovery & data mining, 617–626 (2019).
  5. 関連研究レビュー 7 レコメンドリスト全体を考慮した推薦を行う「バンドル推薦」が提案されている Shalom et al. (2016) [2] - 候補アイテム間の相互影響が一定考慮可能

    - 課題: 考慮する相互影響が「類似度」という単一の尺度に依存 Gong et al. (2019) [3] - 推薦候補の全アイテムで捉えた関係性を考慮したリスト生成が可能 - 課題: リスト内で同時に推薦するアイテムに限定した相互影響は RNNの潜在表現に依存    囮効果のような同時表出による相互影響を捉えきれているとは限らない [2] Shalom, O.S., Koenigstein, N., Paquet, U. and Vanchinathan, H.P.: Beyond Collaborative Filtering: The List Recommendation Problem. In proceedings of the 25th International Conference on World Wide Web, 63–72 (2016). [3] Gong, Y., Zhu, Y., Duan, L., Liu, Q., Guan, Z., Sun, F., Ou, W. and Zhu, K.Q.: Exact-k recommendation via maximal clique optimization. In proceedings of the 25th ACM SIGKDD international conference on knowledge discovery & data mining, 617–626 (2019). 類似度だけでなく ,囮効果のような潜在的なアイテム相互影響を捉えつつ 同時に推薦されるリスト内のアイテム相互影響を明示的に考慮する必要がある
  6. 同時に推薦されるアイテム同士の相互影響を考慮することにより、 レコメンドリスト全体として最適なリストを生成する 本研究の概要 8 目的 貢献 結果 1. Transformerを用いることで、同時に推薦するアイテム同士の 相互影響を捉えた予測モデルを提案

    2. 予測モデルを用いて、レコメンドリストを生成するアルゴリズムを提案 特に、候補アイテム数が多い場合の計算時間増大への対処に注目 ※ あるアイテムのスコアは、同時に推薦するアイテムに依存して変動するため、 単純なスコア順ではないアルゴリズムが必要である 3. 提案手法の有効性を示すための数値実験を実施 - スコア予測モデル → ベースラインよりもAUCが向上することを確認 - リスト生成モデル → 性能劣化を抑えつつ、計算時間の削減ができる ことを確認
  7. 提案手法:概観 レコメンドスコア予測モデル ,レコメンドリスト生成モデルの 2つのモデルで リスト生成を行う - 相互関係を考慮したレコメンドスコア予測モデル - 入力: 予測対象のレコメンドリスト,ユーザ情報,アイテム情報

    - 出力: リストのレコメンドスコア - スコア予測に基づくレコメンドリスト生成モデル - 入力: ユーザ,推薦候補アイテムの集合 - 出力: レコメンドリスト 10 スコア予測 リスト生成 スコア結果から 候補リストを生成 候補リストのスコアをFB
  8. 提案手法: Transfomerを用いたスコア予測 処理フロー 1. ユーザとリスト内アイテム特徴量を結合 2. 結合した特徴をトークンとみなし、 Transformer Encoderに入力 3.

    Transformerの各出力に対しMLPでレコメンドスコアに 変換 4. レコメンドスコアとラベルとの Cross Entropyを計算 12
  9. 提案手法1:シンプルな貪欲法 
 - リストの上から順にアイテムを決定 
 - 現在までに決定したアイテムを 
 所与とし、スコアが最大になる 


    アイテムを採用
 提案手法:レコメンドリスト生成モデル - 計算量のオーダーは、 ユーザ数×アイテム数×推薦アイテム数 - アイテム数が膨大だと計算時間が懸念 - 目的:スコア予測モデルの予測値が最大になるレコメンドリストを得る - 課題:レコメンドリストの候補数が膨大 - 候補数=アイテムの集合全体から推薦数個分のアイテムを選択する組み合わせの数 → 全探索を行うことは一般には困難 - 提案手法:貪欲法に基づくアルゴリズム 1st
 2nd
 3rd
 10th
 ・・・
 所与
 所与
 レコメンドリスト
 スコア予測
 モデル
 同時推薦
 アイテム
 スコア最大の
 アイテム
 13
  10. 提案手法2:スコア比例サンプリング付き貪欲法 
 
 1. 同時推薦アイテムがない状態で全アイテムに対して予測を行い、予測スコアを事前計算 
 2. リストの上から順に以下を繰り返し、レコメンドリストを決定 
 a.

    1の予測スコアに比例する重みで、指定個数分のアイテムをサンプリング 
 b. 現在までに決定したアイテムを所与とし、 サンプリングしたアイテムのうち 、
 スコアが最大になるアイテムを採用 
 提案手法:レコメンドリスト生成モデル 1st
 2nd
 3rd
 10th
 ・・・
 所与
 所与
 レコメンドリスト
 スコア予測
 モデル
 同時推薦
 アイテム
 スコア最大の
 アイテム
 事前計算した予測スコア アイテムA: 0.40 アイテムB: 0.24 アイテムC: 0.16 ・・・ ※ ユーザ単位で固定 予測対象アイテム
 
 アイテムA
 アイテムC
 ・・・
 ※ 反復の度にリサンプリング
 予測スコアに比例する確率でサ ンプリング
 
 アイテムA: w.p. 0.04
 アイテムB: w.p. 0.024
 ・・・

  11. 提案手法2:スコア比例サンプリング付き貪欲法 
 
 1. 同時推薦アイテムがない状態で全アイテムに対して予測を行い、予測スコアを事前計算 
 2. リストの上から順に以下を繰り返し、レコメンドリストを決定 
 a.

    1の予測スコアに比例する重みで、指定個数分のアイテムをサンプリング 
 b. 現在までに決定したアイテムを所与とし、 サンプリングしたアイテムのうち 、
 スコアが最大になるアイテムを採用 
 提案手法:レコメンドリスト生成モデル 以下の点において、ランダムサンプリングよりも本研究の問題に適していると考えられる - ユーザの嗜好をサンプリングに反映できる - 事前の予測でスコア下位のアイテムも、確率的に予測対象に含まれる ※ アイテム同士の相互影響により、必ずしも事前の予測で上位のアイテムが良いとは限らない - 予測対象とするアイテムの数を調整することにより、実行時間を調整しやすい 15
  12. 実験結果:評価方法 評価を行う上での課題 - 生成したレコメンドリスト自体を直接的に評価することが理想だが ,生成したレコメンドリストを実 際にユーザーに表出したログを用意することは難しい スコア予測モデル ,リスト作成モデルそれぞれで評価を行う - レコメンドスコア予測モデル

    - 実際に表出したレコメンドリストを入力し ,アクションがあったアイテムを正確に予測できる か評価 - リスト生成モデル - レコメンドスコアが適切であることを前提とし ,レコメンドリストのスコアを評価 17
  13. 実験結果:評価方法概観 使用データセット - MIND (Microsoft News Recommendation Dataset) [4] -

    マイクロソフトが提供するニュースレコメンドデータセット - 同時に表出したニュース情報 , ニュース内容, ユーザーアクションログ, ユーザー過去アクション等の情報が含まれている 18 [4]MIND: A Large-scale Dataset for News Recommendation. Annual Meeting of the Association for Computational Linguistics (2020).
  14. 実験条件 - MINDデータセットからユーザーがアイテムを見比べ相互影響が発生しやすいであろう 表出アイテム数が3~10個のレコメンドログに絞る 比較アルゴリズム - 比較手法1:同時表出した他アイテムの特徴量を 用いない LightGBMモデル -

    比較手法2:同時表出した他アイテムの特徴量を 用いたLightGBMモデル Transformerに入力した情報量と合わせる目的 - 提案手法:Transformerを用いたスコア予測モデル 評価指標 - レコメンドリスト内の各アイテムのスコアを算出し,実績値と比較することで以下を計算 - PR-AUC - ROC-AUC 実験結果:スコア予測モデル 19
  15. 実験結果:スコア予測モデル 結果 - 提案手法 vs 比較手法 →PR-AUC,ROC-AUCで改善を確認 - 比較手法1 vs

    比較手法2 →同時表出特徴量ありでは PR-AUCが劣化,ROC-AUCも大きな改善が確認できない  アイテム同士の相互関係をうまく扱えていないことが分かる 使用モデル 同時表出特徴量 PR-AUC ROC-AUC 比較手法1 LightGBM 0.241 0.615 比較手法2 LightGBM ✅ 0.238 0.626 提案手法 Transformer ✅ 0.267 (+10.7%) 0.659 (+7.1%) 20
  16. 実験条件 - MINDデータセットを元に、ユーザ数 1000、アイテム数100にランダムサンプリング - 貪欲法の中で用いるサンプリングでは、予測対象のアイテム数が 20になるように調整 比較アルゴリズム - ベースライン:同時に推薦するアイテムがない状態で予測を行い、予測スコア順に推薦

    - 貪欲法:シンプルな貪欲法 - 貪欲法(ランダムサンプリング):ランダムサンプリングを用いた貪欲法 - 貪欲法(スコア比例サンプリング):スコア比例サンプリングを用いた貪欲法 評価指標 - スコア:生成したレコメンドリストに対する予測スコア - 実行時間:1つのレコメンドリスト生成にかかる時間 実験結果:リスト生成モデル 21
  17. 実験結果:リスト生成モデル 結果 - 貪欲法 vs ベースライン → 大幅なスコア改善を確認 - 貪欲法(スコア比例サンプリング)

    vs 貪欲法・貪欲法(ランダムサンプリング) → 貪欲法に対するスコアの悪化を抑えながら、実行時間を 50%以上短縮 スコア(対ベースライン比) 実行時間 ベースライン - 0.027 秒 貪欲法 + 74.7 % 0.250 秒 貪欲法(ランダムサンプリング) + 48.9 % 0.089 秒 貪欲法(スコア比例サンプリング) + 57.2 % 0.116 秒 22