Recommending What Video to Watch Next: A Multitask Ranking System

Recommending What Video to Watch Next: A Multitask Ranking System
田中涼 @alpicola (SmartNews)

論文の紹介今回の RecSys long papers に Google の論文が2本 - Recommending
What Video to Watch Next: A Multitask Ranking System [Z Zhao et al.] - Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendations [X Yi et al.]

Retrieve & Ranking アーキテクチャ Retrieve Database Ranking 数百数十今日はここの話

問題設定 - YouTube の「次の動画」 - Implicit feedback - Multi-objective -
User engagement (click, watch) - User satisfaction (like, share) - スケーラビリティの要求 - “billions of items and users” - Ranking フェーズ

論文の貢献 - Multi-gate Mixture-of-Expert (MMoE) [KDD 2018] によるマルチタスク学習 -
Wide & Deep [DLRS 2016] 風の選択バイアスの削減手法 - YouTube プロダクション環境での実験

MMoE バイアス削減

Multi-gate Mixture-of-Expert (MMoE) [J Ma et al., KDD 2018] -
マルチタスク学習の手法 - Shared-Bottom model (左) と比べ、タスク間の相関による悪影響を受けにくい

学習データの選択バイアス - 特にここでは表示位置によるバイアス (position bias) - ランキング上位がクリックされやすい

選択バイアスの削減 - ‘Shallow’ tower (Wide & Deep の wide) で位置バイ
アスを表現 - User engagementのタスクが対象 - 学習時 position feature にはモデルが依存すぎないよう drop-out をかける

実験結果 (MMoE) - ベースラインはShared-Bottom - ユニット数を調整して同じ計算コストあたりのパフォーマンスを比べる

実験結果 (バイアス削減) - ベースライン - Input Feature: position featureを他の入力と一緒に使う -
Adversarial Loss: Adversarial Discriminative Domain Adaptation [CVPR 2017] などの手法を応用

著者らによる補足 (5.4 Discussion) - プロダクションで提供するときのコストを考え、単純でわかりやすいモデル・手法を好んで使った - 他の手法は以下の理由でマッチしないことが多かった - マルチモーダルな入力
- Multi-objective - Noisy で sparse なデータ - スケーラビリティ - 分散環境での学習

私の感想 - よりよい user satisfaction のために - マルチタスク学習として解くのはよさそう - Shared-Bottom
でも十分かも - 各タスクのスコアはどう使う？ - 論文では手動設定重みによる weighted sum - バイアス削減 - シンプルな実装なのはよい - インパクトは出てるのだろうか？

Recommending What Video to Watch Next: A Multit...

Recommending What Video to Watch Next: A Multitask Ranking System

alpicola

More Decks by alpicola

Other Decks in Research

Featured

Transcript