Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ランダム欠損データに依存しない推薦システムのバイアス除去 / towards-resolvin...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Masahiro Nomura
July 02, 2022
Research
320
0
Share
ランダム欠損データに依存しない推薦システムのバイアス除去 / towards-resolving-propensity-contradiction-in-offline-recommender-learning
Masahiro Nomura
July 02, 2022
More Decks by Masahiro Nomura
See All by Masahiro Nomura
転移学習によるハイパーパラメータ最適化の高速化 / warm_starting_cma
nmasahiro
0
2.3k
論文紹介: IRのためのパラメータチューニング / ir-tuning
nmasahiro
0
540
論文紹介: Sample Reuse via Importance Sampling in Information Geometric Optimization / sample_reuse_igo
nmasahiro
0
300
機械学習における ハイパーパラメータ最適化の理論と実践 / hpo_theory_practice
nmasahiro
30
43k
論文紹介 : Population Based Augmentation: Efficient Learning of Augmentation Policy Schedules
nmasahiro
1
780
広告とAI(とハイパーパラメータ最適化) / Ad with AI
nmasahiro
1
2.2k
Other Decks in Research
See All in Research
「車1割削減、渋滞半減、公共交通2倍」を 熊本から岡山へ@RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
1
940
一般道の交通量減少と速度低下についての全国分析と熊本市におけるケーススタディ(20251122 土木計画学研究発表会)
trafficbrain
0
190
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
200
IEEE AIxVR 2026 Keynote Talk: "Beyond Visibility: Understanding Scenes and Humans under Challenging Conditions with Diverse Sensing"
miso2024
0
150
視覚から身体性を持つAIへ: 巧緻な動作の3次元理解
tkhkaeio
1
250
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
220
業界横断 副業コンプライアンス調査 三者(副業者・本業先・発注者)におけるトラブル認知ギャップの構造分析
fkske
0
1.2k
Using our influence and power for patient safety
helenbevan
0
290
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
1k
From Data Meshes to Data Spaces
posedio
PRO
0
710
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
130
競合や要望に流されない─B2B SaaSでミニマム要件を決めるリアルな取り組み / Don't be swayed by competitors or requests - A real effort to determine minimum requirements for B2B SaaS
kaminashi
0
1.3k
Featured
See All Featured
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
A better future with KSS
kneath
240
18k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
440
YesSQL, Process and Tooling at Scale
rocio
174
15k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
240
Deep Space Network (abreviated)
tonyrice
0
110
Code Reviewing Like a Champion
maltzj
528
40k
Agile that works and the tools we love
rasmusluckow
331
21k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
99
WENDY [Excerpt]
tessaabrams
10
37k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
120
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
220
Transcript
ランダム⽋損データに依存しない 推薦システムのバイアス除去 野村 将寛 (Masahiro Nomura) CyberAgent AI Lab 07/02(Sat)@CFML勉強会
https://cfml.connpass.com/event/249531/ 1
名前: • 野村 将寛 所属: • CyberAgent AI Lab: Creative
Research Team 研究: • ハイパーパラメータ最適化 • 進化計算 • ベイズ最適化 • 推薦システム • バンディット • ⾃然⾔語処理 2 ⾃⼰紹介
Towards Resolving Propensity Contradiction in Offline Recommender Learning Yuta Saito
(Cornell) and Masahiro Nomura (CyberAgent) IJCAI’22 (Long Talk) Acceptance rate=15%, Long Talk (top 4% of submissions) 3
推薦システムは⾄るところで使われている Netflix, Spotify, Amazonなどのオンラインプラットフォームでは アルゴリズム的な推薦によりアイテムを⾃動的に推薦している 4 Spotify Netflix
協調フィルタリング ユーザのそれぞれのアイテムに対する選好を観測された評価から学習する 5 Users Matrix Factorization - 1 3 4
5 - - - 3 Items
真の評価分布と観測される評価分布のズレ 6 選択バイアス • 過去の推薦⽅法 • ユーザの選択⾏動 真の評価分布 (Marlin et
al., UAIʼ07) Figure 2. Marlin, B., Zemel, R. S., Roweis, S., and Slaney, M. Collaborative filtering and the missing at random assumption. In UAI, 2007. 観測された評価分布
理想的な評価指標 ユーザ/アイテム対 が与えられたもとで, 7 局所損失 (⼆乗損失, 絶対値損失等) ⼀様なユーザ/アイテム分布のもとでの 経験平均
観測情報から理想的な損失をどう推定するか 8 観測から計算可能な損失 理想的な損失 ︖ 推定
ナイーブ推定量 9 観測データ上の局所損失の経験平均としてナイーブ推定量を定義 多くの推薦システムではこのナイーブ損失を最適化しようとしている 観測データ
ナイーブ推定量は”バイアス”されている 10 ナイーブ推定量の期待値は理想的な損失と⼀致しない バイアスが存在
逆傾向スコア (IPS) 推定量 11 IPS推定量は傾向スコアの逆数で重みづけることでバイアスを除去している 観測データ 傾向スコア
IPS推定量は”バイアス”されていない 12 IPS推定量は理想的な損失を期待値の点でうまく近似する バイアスなし IPSを使えばよい︖
傾向スコアの推定とその⽭盾 13 IPS推定量には傾向スコアの推定が必要 • しかし,真の傾向スコアは実⽤上⼿に⼊らない 既存研究では傾向スコアを⼗分に推定するため,真の分布からのランダムな (Missing-completely-at-random; MCAR) データを必要としている •
元々はMCARデータを使わずにうまく推定するのが⽬的だった • モチベーションと⽭盾することが起こっている
傾向スコアの推定とその⽭盾 14 IPS推定量には傾向スコアの推定が必要 • しかし,真の傾向スコアは実⽤上⼿に⼊らない 既存研究では傾向スコアを⼗分に推定するため,真の分布からのランダムな (Missing-completely-at-random; MCAR) データを必要としている •
元々はMCARデータを使わずにうまく推定するのが⽬的だった • モチベーションと⽭盾することが起こっている 傾向スコアに依存しない形で正確な評価予測器を学習することは可能だろうか︖
Propensity Matrix Divergenceの導⼊ 15 傾向スコアの代わりに,Propensity Matrix Divergenceを定義する MNARとMCAR⽋損メ カニズム間の違いを計測
理想的損失の理論的上界 16 PMDを使うことで,傾向スコアに依存しない理想的損失の上界を導出する With probability at least 1-δ: Propensity Matrix
Divergence (PMD) ナイーブ損失 ラデマッハ複雑度
Domain Adversarial Matrix Factorization (DAMF) 17 理論的上界から⽰唆された損失を最⼩化する:
Domain Adversarial Matrix Factorization (DAMF) 18 PMDを経験的に近似する: 得られたR*を使って損失関数を最⼩化:
実験: データセット 19 真の分布と観測分布にズレのある2つのデータセットを使⽤ Yahoo! R3: ⾳楽の評価データセット(15400 users) Coat: ショッピングデータセット(300
users)
実験: ⽐較⼿法 ⾏列分解を以下の損失関数によって最適化: • ナイーブ損失 • IPS損失 [Schnabel et al.2016]
• Doubly Robust(DR)損失 [Wang et al.2019] • CauseE [Bonner and Vasile.2018] • DAMF (our proposal) 20 傾向スコアが必要 MCARデータが必要& 理論的解釈が困難 傾向スコアは不必要 & 理論的妥当性を有する
実験: ⽐較⼿法 IPS損失とDR損失については,傾向スコアとして以下を使⽤: 21 真の傾向スコアを使った場合についても参考として報告
実験: 傾向スコアベースの⽅法の問題点 IPS/DRを⽤いた⽅法は,MCARデータが使えない場合には性能が低下 22 傾向スコアベース⼿法の問題を実験的に確認
実験: 予測の評価 DAMFは予測の評価において,現実的なベースラインより良い性能を⽰す 23
実験: ランキング性能 DAMFはランキング指標において,全てのベースラインより良い性能を⽰す 24
実験: 理論的上界 傾向スコアに独⽴な理論的上界は概ね適切に機能している 25
• 選択バイアス下における傾向スコアに依存した既存⼿法の問題点を指摘 • 適切な推定のためには実⽤上得ることの難しいMCARデータが必要 • 本研究: MNARデータのみから学習を⾏う推薦システムを構築する • 傾向スコアに依存しない汎化誤差バウンドを導出 •
そのバウンドを最⼩化する⼿法を提案 • MNARデータのみの設定でも優れた性能を⽰すことを実験で確認 26 まとめ
Thank you for listening! 27