Transformerを用いたアイテム間の相互影響を考慮したレコメンドリスト生成

株式会社リクルートデータテクノロジーラボ     *池田柳之介　濱田賢吾　高橋諒     2025年5月29日  
人工知能学会全国大会@グランキューブ大阪   [3E1-GS-10] AI応用：製造   Transformerを用いたアイテム間の  相互影響を考慮したレコメンドリスト生成 1

Agenda     1. 研究の概要 2. 提案手法 3. 実験結果 4.
まとめ 2

背景：一般的なレコメンドモデルユーザごとに所与の数のアイテムを事前に選択し，ユーザの訪問に対してそれらをリスト形式で表出するレコメンドシステムを想定する - 上記において、以下のようなアルゴリズムがよく用いられる 1. ユーザの各アイテムに対する嗜好度を個別にスコアリング 2.
得られたスコアの降順でアイテムを推薦アイテムD   3 アイテムA:　0.2 アイテムB:　0.4 アイテムC:　0.1 アイテムD:　0.5 アイテムE:　0.3 予測を行ったアイテムごとの   嗜好度/クリック率/コンバージョン率   アイテムB   アイテムE   アイテムA   スコアの降順でアイテムを推薦  

背景：同時に推薦されるアイテム同士の相互影響同時に推薦されるアイテム同士は，相互に影響を与えると考えるのが自然 - ＝ユーザは推薦されたアイテム同士を比較しながら行動する - → 同一のアイテムを推薦する場合でも、同時に推薦するアイテムによって購買意欲等が変化すると考えられる例）囮効果[1]、需要の食い合い
4 S M L ¥100 ¥140 ¥150 S L ¥100 ¥150 [1]Mousavi, N., Adamopoulos, P. and Bockst- edt, J.: The Decoy Effect and Recommendation Systems. Information Systems Research, 34(4), 1533– 1553 (2023).

背景：同時に推薦されるアイテム同士の相互影響同時に推薦されるアイテム同士は，相互に影響を与えると考えるのが自然 - ＝ユーザは推薦されたアイテム同士を比較しながら行動する - → 同一のアイテムを推薦する場合でも、同時に推薦するアイテムによって購買意欲等が変化すると考えられる例）囮効果[1]、需要の食い合い
5 S M L ¥100 ¥140 ¥150 購買を促進 S L ¥100 ¥150 囮になるような商品を同時に並べることによって特定商品の購買を促進する囮アイテム個別のスコアリングでは、このような相互影響を考慮できない [1]Mousavi, N., Adamopoulos, P. and Bockst- edt, J.: The Decoy Effect and Recommendation Systems. Information Systems Research, 34(4), 1533– 1553 (2023).

関連研究レビュー 6 レコメンドリスト全体を考慮した推薦を行う「バンドル推薦」が提案されている Shalom et al. (2016) [2] - リスト内のアイテム同士の類似度を特徴量として活用する二段階学習法を提案
→ 候補アイテム間の相互影響が一定考慮可能 Gong et al. (2019) [3] - Graph Attention Network(GAttN) と Recurrent Neural Network(RNN)を組み合わせ、候補アイテム間の関係性を考慮しながら動的にレコメンドリストを生成する手法を提案 → 推薦候補の全アイテムで捉えた関係性を考慮したリスト生成が可能 [2] Shalom, O.S., Koenigstein, N., Paquet, U. and Vanchinathan, H.P.: Beyond Collaborative Filtering: The List Recommendation Problem. In proceedings of the 25th International Conference on World Wide Web, 63–72 (2016). [3] Gong, Y., Zhu, Y., Duan, L., Liu, Q., Guan, Z., Sun, F., Ou, W. and Zhu, K.Q.: Exact-k recommendation via maximal clique optimization. In proceedings of the 25th ACM SIGKDD international conference on knowledge discovery & data mining, 617–626 (2019).

関連研究レビュー 7 レコメンドリスト全体を考慮した推薦を行う「バンドル推薦」が提案されている Shalom et al. (2016) [2] - 候補アイテム間の相互影響が一定考慮可能
- 課題: 考慮する相互影響が「類似度」という単一の尺度に依存 Gong et al. (2019) [3] - 推薦候補の全アイテムで捉えた関係性を考慮したリスト生成が可能 - 課題: リスト内で同時に推薦するアイテムに限定した相互影響は RNNの潜在表現に依存　　囮効果のような同時表出による相互影響を捉えきれているとは限らない [2] Shalom, O.S., Koenigstein, N., Paquet, U. and Vanchinathan, H.P.: Beyond Collaborative Filtering: The List Recommendation Problem. In proceedings of the 25th International Conference on World Wide Web, 63–72 (2016). [3] Gong, Y., Zhu, Y., Duan, L., Liu, Q., Guan, Z., Sun, F., Ou, W. and Zhu, K.Q.: Exact-k recommendation via maximal clique optimization. In proceedings of the 25th ACM SIGKDD international conference on knowledge discovery & data mining, 617–626 (2019). 類似度だけでなく ,囮効果のような潜在的なアイテム相互影響を捉えつつ同時に推薦されるリスト内のアイテム相互影響を明示的に考慮する必要がある

同時に推薦されるアイテム同士の相互影響を考慮することにより、レコメンドリスト全体として最適なリストを生成する本研究の概要 8 目的貢献結果 1. Transformerを用いることで、同時に推薦するアイテム同士の相互影響を捉えた予測モデルを提案
2. 予測モデルを用いて、レコメンドリストを生成するアルゴリズムを提案特に、候補アイテム数が多い場合の計算時間増大への対処に注目 ※ あるアイテムのスコアは、同時に推薦するアイテムに依存して変動するため、単純なスコア順ではないアルゴリズムが必要である 3. 提案手法の有効性を示すための数値実験を実施 - スコア予測モデル → ベースラインよりもAUCが向上することを確認 - リスト生成モデル → 性能劣化を抑えつつ、計算時間の削減ができることを確認

まとめ 9

提案手法：概観レコメンドスコア予測モデル ,レコメンドリスト生成モデルの 2つのモデルでリスト生成を行う - 相互関係を考慮したレコメンドスコア予測モデル - 入力: 予測対象のレコメンドリスト,ユーザ情報,アイテム情報
- 出力: リストのレコメンドスコア - スコア予測に基づくレコメンドリスト生成モデル - 入力: ユーザ,推薦候補アイテムの集合 - 出力: レコメンドリスト 10 スコア予測リスト生成スコア結果から候補リストを生成候補リストのスコアをFB

提案手法： Transfomerを用いたスコア予測 Transformerの自己注意機構 (Self-Attention)で同時表出したアイテム間の相互影響を明示的に考慮してスコア予測を行う Self-Attentionとは - 自然言語処理では入力文中のトークン (単語)間の類似度や重要度等の関係性を獲得する -
本研究では自然言語での「単語」に当たるものを「アイテム」に置き換えて活用する Transformer: A Novel Neural Network Architecture for Language Understanding 11

提案手法： Transfomerを用いたスコア予測処理フロー 1. ユーザとリスト内アイテム特徴量を結合 2. 結合した特徴をトークンとみなし、 Transformer Encoderに入力 3.
Transformerの各出力に対しMLPでレコメンドスコアに変換 4. レコメンドスコアとラベルとの Cross Entropyを計算 12

提案手法1：シンプルな貪欲法   - リストの上から順にアイテムを決定   - 現在までに決定したアイテムを   所与とし、スコアが最大になる  
アイテムを採用  提案手法：レコメンドリスト生成モデル - 計算量のオーダーは、ユーザ数×アイテム数×推薦アイテム数 - アイテム数が膨大だと計算時間が懸念 - 目的：スコア予測モデルの予測値が最大になるレコメンドリストを得る - 課題：レコメンドリストの候補数が膨大 - 候補数＝アイテムの集合全体から推薦数個分のアイテムを選択する組み合わせの数 → 全探索を行うことは一般には困難 - 提案手法：貪欲法に基づくアルゴリズム 1st  2nd  3rd  10th  ・・・  所与  所与  レコメンドリスト  スコア予測  モデル  同時推薦  アイテム  スコア最大の  アイテム  13

提案手法2：スコア比例サンプリング付き貪欲法     1. 同時推薦アイテムがない状態で全アイテムに対して予測を行い、予測スコアを事前計算   2. リストの上から順に以下を繰り返し、レコメンドリストを決定   a.
1の予測スコアに比例する重みで、指定個数分のアイテムをサンプリング   b. 現在までに決定したアイテムを所与とし、サンプリングしたアイテムのうち、  スコアが最大になるアイテムを採用   提案手法：レコメンドリスト生成モデル 1st  2nd  3rd  10th  ・・・  所与  所与  レコメンドリスト  スコア予測  モデル  同時推薦  アイテム  スコア最大の  アイテム  事前計算した予測スコアアイテムA: 0.40 アイテムB: 0.24 アイテムC: 0.16 ・・・ ※ ユーザ単位で固定予測対象アイテム    アイテムA  アイテムC  ・・・  ※ 反復の度にリサンプリング  予測スコアに比例する確率でサンプリング    アイテムA: w.p. 0.04  アイテムB: w.p. 0.024  ・・・ 

提案手法2：スコア比例サンプリング付き貪欲法     1. 同時推薦アイテムがない状態で全アイテムに対して予測を行い、予測スコアを事前計算   2. リストの上から順に以下を繰り返し、レコメンドリストを決定   a.
1の予測スコアに比例する重みで、指定個数分のアイテムをサンプリング   b. 現在までに決定したアイテムを所与とし、サンプリングしたアイテムのうち、  スコアが最大になるアイテムを採用   提案手法：レコメンドリスト生成モデル以下の点において、ランダムサンプリングよりも本研究の問題に適していると考えられる - ユーザの嗜好をサンプリングに反映できる - 事前の予測でスコア下位のアイテムも、確率的に予測対象に含まれる ※ アイテム同士の相互影響により、必ずしも事前の予測で上位のアイテムが良いとは限らない - 予測対象とするアイテムの数を調整することにより、実行時間を調整しやすい 15

まとめ 16

実験結果：評価方法評価を行う上での課題 - 生成したレコメンドリスト自体を直接的に評価することが理想だが ,生成したレコメンドリストを実際にユーザーに表出したログを用意することは難しいスコア予測モデル ,リスト作成モデルそれぞれで評価を行う - レコメンドスコア予測モデル
- 実際に表出したレコメンドリストを入力し ,アクションがあったアイテムを正確に予測できるか評価 - リスト生成モデル - レコメンドスコアが適切であることを前提とし ,レコメンドリストのスコアを評価 17

実験結果：評価方法概観使用データセット - MIND (Microsoft News Recommendation Dataset) [4] -
マイクロソフトが提供するニュースレコメンドデータセット - 同時に表出したニュース情報 , ニュース内容, ユーザーアクションログ, ユーザー過去アクション等の情報が含まれている 18 [4]MIND: A Large-scale Dataset for News Recommendation. Annual Meeting of the Association for Computational Linguistics (2020).

実験条件 - MINDデータセットからユーザーがアイテムを見比べ相互影響が発生しやすいであろう表出アイテム数が3~10個のレコメンドログに絞る比較アルゴリズム - 比較手法1：同時表出した他アイテムの特徴量を用いない LightGBMモデル -
比較手法2：同時表出した他アイテムの特徴量を用いたLightGBMモデル Transformerに入力した情報量と合わせる目的 - 提案手法：Transformerを用いたスコア予測モデル評価指標 - レコメンドリスト内の各アイテムのスコアを算出し，実績値と比較することで以下を計算 - PR-AUC - ROC-AUC 実験結果：スコア予測モデル 19

実験結果：スコア予測モデル結果 - 提案手法 vs 比較手法 →PR-AUC,ROC-AUCで改善を確認 - 比較手法1 vs
比較手法2 →同時表出特徴量ありでは PR-AUCが劣化,ROC-AUCも大きな改善が確認できない　アイテム同士の相互関係をうまく扱えていないことが分かる使用モデル同時表出特徴量 PR-AUC ROC-AUC 比較手法1 LightGBM 0.241 0.615 比較手法2 LightGBM ✅ 0.238 0.626 提案手法 Transformer ✅ 0.267 (+10.7%) 0.659 (+7.1%) 20

実験条件 - MINDデータセットを元に、ユーザ数 1000、アイテム数100にランダムサンプリング - 貪欲法の中で用いるサンプリングでは、予測対象のアイテム数が 20になるように調整比較アルゴリズム - ベースライン：同時に推薦するアイテムがない状態で予測を行い、予測スコア順に推薦
- 貪欲法：シンプルな貪欲法 - 貪欲法（ランダムサンプリング）：ランダムサンプリングを用いた貪欲法 - 貪欲法（スコア比例サンプリング）：スコア比例サンプリングを用いた貪欲法評価指標 - スコア：生成したレコメンドリストに対する予測スコア - 実行時間：1つのレコメンドリスト生成にかかる時間実験結果：リスト生成モデル 21

実験結果：リスト生成モデル結果 - 貪欲法 vs ベースライン → 大幅なスコア改善を確認 - 貪欲法（スコア比例サンプリング）
vs 貪欲法・貪欲法（ランダムサンプリング） → 貪欲法に対するスコアの悪化を抑えながら、実行時間を 50%以上短縮スコア（対ベースライン比）実行時間ベースライン - 0.027 秒貪欲法 + 74.7 % 0.250 秒貪欲法（ランダムサンプリング） + 48.9 % 0.089 秒貪欲法（スコア比例サンプリング） + 57.2 % 0.116 秒 22

まとめ 23

まとめ同時に表出したアイテム同士の相互影響を考慮したレコメンドリスト生成を実現 - レコメンドスコア予測,レコメンドリスト作成の2つのモデルを用いて現実的な実行時間でのレコメンドリスト生成が可能 - 数値実験の結果,既存のレコメンド手法からの有効性を確認今後の展望 - グラフニューラルネットワーク等高度な推論手法との比較やこれらを取り込んだより高性能なス
コア予測モデルの作成 - 貪欲法が困難な場合においての予測対象アイテムの絞り込み方法の検討 - アイテム埋め込みを用いた絞り込み等 - プロダクション環境でのテスト 24

Transformerを用いたアイテム間の相互影響を考慮したレコメンドリスト生成

Transformerを用いたアイテム間の相互影響を考慮したレコメンドリスト生成

Recruit PRO

More Decks by Recruit

Other Decks in Technology

Featured

Transcript

株式会社リクルートデータテクノロジーラボ     *池田柳之介　濱田賢吾　高橋諒     2025年5月29日

Agenda     1. 研究の概要 2. 提案手法 3. 実験結果 4.

関連研究レビュー 6 レコメンドリスト全体を考慮した推薦を行う「バンドル推薦」が提案されている Shalom et al. (2016) [2] - リスト内のアイテム同士の類似度を特徴量として活用する二段階学習法を提案

関連研究レビュー 7 レコメンドリスト全体を考慮した推薦を行う「バンドル推薦」が提案されている Shalom et al. (2016) [2] - 候補アイテム間の相互影響が一定考慮可能

Agenda     1. 研究の概要 2. 提案手法 3. 実験結果 4.

提案手法： Transfomerを用いたスコア予測処理フロー 1. ユーザとリスト内アイテム特徴量を結合 2. 結合した特徴をトークンとみなし、 Transformer Encoderに入力 3.

提案手法1：シンプルな貪欲法   - リストの上から順にアイテムを決定   - 現在までに決定したアイテムを   所与とし、スコアが最大になる

提案手法2：スコア比例サンプリング付き貪欲法     1. 同時推薦アイテムがない状態で全アイテムに対して予測を行い、予測スコアを事前計算   2. リストの上から順に以下を繰り返し、レコメンドリストを決定   a.

提案手法2：スコア比例サンプリング付き貪欲法     1. 同時推薦アイテムがない状態で全アイテムに対して予測を行い、予測スコアを事前計算   2. リストの上から順に以下を繰り返し、レコメンドリストを決定   a.

Agenda     1. 研究の概要 2. 提案手法 3. 実験結果 4.

実験結果：評価方法概観使用データセット - MIND (Microsoft News Recommendation Dataset) [4] -

実験結果：スコア予測モデル結果 - 提案手法 vs 比較手法 →PR-AUC,ROC-AUCで改善を確認 - 比較手法1 vs

実験結果：リスト生成モデル結果 - 貪欲法 vs ベースライン → 大幅なスコア改善を確認 - 貪欲法（スコア比例サンプリング）

Agenda     1. 研究の概要 2. 提案手法 3. 実験結果 4.

Transformerを用いたアイテム間の 相互影響を考慮したレコメンドリスト生成

Transformerを用いたアイテム間の 相互影響を考慮したレコメンドリスト生成

More Decks by Recruit

Other Decks in Technology

Featured

Transcript

Transformerを用いたアイテム間の相互影響を考慮したレコメンドリスト生成

Transformerを用いたアイテム間の相互影響を考慮したレコメンドリスト生成