main.pdf

バイアスのあるデータをIPWで補正してUplift Modeingをやってみた 1

⾃⼰紹介⼩沼塁, @knmr_u 職業とか趣味とか機械学習エンジニア PMに鞍替え中 kaggle, 銅 1
(だけ) 2

話す内容テーマバイアスのあるデータを IPW で補正して Uplift Modeing をやってみたよ TL;DR Uplift
Moddeling で介⼊効果を最⼤化できるよバイアスのあるデータでも Uplift Modeling ができたよただし、傾向スコアをあまり信じすぎるのは危ないよ 3

参考資料仕事で始める機械学習岩波データサイエンス vol.03 4

実装について⾃作ライブラリ pycalf を作りました今回の実装については上記のライブラリにまとまっています 5

ToC . Uplift Modeling による介⼊効果の最⼤化 . Uplift Modeling の弱点 .
IPW (Inverse Probability Weighting) とは . IPW で Uplift Modeling の弱点を補填 . バイアスを補填した Uplift Modeling の結果 . IPW (傾向スコア) の弱点 . おまけ 6

Uplift Modeling による介⼊効果の最⼤化 7

Uplift Modeling の⽬的何らかのマーケティング施策を想定する右図のような四象限を仮定する Uplift Modeling では、介⼊することでCVする群である「説得可能」
を⾒つける 8

ABテストを通じたUplift Modelingの⼿順(1/7) ABテストを⾏い、以下のデータを取得する X: 特徴量, Z: 介⼊有無 (0 or 1),
Y: CV有無 (0 or 1) 9

ABテストを通じたUplift Modelingの⼿順(2/7) Z==0, Z==1 でデータを分けるつまり介⼊有無でデータを分割する 10

ABテストを通じたUplift Modelingの⼿順(3/7) Z==0, Z==1 ごとのモデルを作成 11

ABテストを通じたUplift Modelingの⼿順(4/7) 同様の検証データに対して作成したモデで予測 12

ABテストを通じたUplift Modelingの⼿順(5/7) 予測値からUplift Score と Lift を取得 Uplift_Score = treat_proba/control_proba
Lift = treat_proba − control_proba 13

ABテストを通じたUplift Modelingの⼿順(6/7) AUUC でモデルの評価を⾏う⻘い線が介⼊した場合左からUpliftScoreが⾼い順に介⼊効果を積み上げている曲線が下ぶれてくるあたりから天邪⻤が含まれてくる 14

ABテストを通じたUplift Modelingの⼿順(7/7) UpliftScoreでソートしたLiftの累積和が最⼤値になるポイントを介⼊閾値に決定 AUUCの横軸をデータ数からUpliftScoreに変える UpliftScore = 1.1 あたりが最も介⼊効果が⾼
いことがわかる 15

Uplift Modeling の弱点 ABテストを⾏ったデータが必要ということ（システム構成が複雑だとか？ユースケースあるの？とかは置いてといて） 16

Uplift Modeling が仮定していること ABテストのより得られた反実仮想のデータを学習する 17

バイアスをIPWで補正介⼊有無により特徴量に偏りが⽣じる場合、反実仮想のデータが⼿に⼊らないそこで、IPWを使えばバイアスを補填できるのではないかと考えた 18

IPW (Inverse Probability Weighting) とは介⼊有無を学習したモデルの予測値が傾向スコア傾向スコアを逆確率変換したものを重みとするこれをIPWと呼ぶ IPWは介⼊が必然である個体を軽く、介⼊が偶然である個体を重く扱う上記のような処理をすることでデータの偏りを調整する
19

傾向スコアの求め⽅特徴量から介⼊有無を予測するモデルを作成そのモデルの予測値を傾向スコアとするイメージ図 20

IPWのイメージ図引⽤: 医学統計セミナーアドバンスコース統計的因果推論と傾向スコア 21

IPW で Uplift Modeling の弱点を補填⽴ち戻ると、バイアスのあるデータで Uplift Modeling がしたい
しかし、Uplift Modelig はRCTのような反実仮想を想定したデータが必要バイアスがあってもIPWによる補正で反実仮想を想定したデータを⽤意できるのではないか 22

重み付けモデルのイメージ図移⾏の⼿順は通常のUplift Modelingと同じ 23

バイアスを補填した Uplift Modeling の結果それっぽいAUUCが出てくることが確認できた。曲線のガタツキはデータ量によるものなのでデータが少ないときは注意が必要詳しい実装はこちら 24

IPWの弱点分類精度が⾼すぎる場合、以下のようなことが起こる極端な重み付け同質のデータが存在しない詳しくは岩波DS vol.03 で 25

積み残しモデルの検証が不⼗分意図した振る舞いなのかを検証するのが困難で、 ABテストの場合とバイアスがある場合のモデルの⽐較をしたいが単純には⽐較できない検証の⽅法についてを真⾯⽬に考える必要がある 26

まとめ Uplift Moddeling で介⼊効果を最⼤化できるよ介⼊することでCVする「説得可能」なセグメントを⾒つけることができるバイアスのあるデータでも Uplift Modeling ができたよ IPWをsample_weightに設定することで反実仮想を仮定することができる
ただし、傾向スコアをあまり信じすぎるのは危ないよ傾向スコアが極端な値を取っていないか、ある程度重なりがあるか確認する必要がある 27

おまけ実装はpycalfのexampleにあります傾向スコアを利⽤しない⼿法として Uber が開発していた causalML がある meta-learner や causal-tree
といった⼿法が使われている（らしい） causalML の調査資料についてはこれ 28

おわり 29

main.pdf

main.pdf

konumaru

More Decks by konumaru

Other Decks in Technology

Featured

Transcript

バイアスのあるデータをIPWで補正してUplift Modeingをやってみた 1

⾃⼰紹介⼩沼塁, @knmr_u 職業とか趣味とか機械学習エンジニア PMに鞍替え中 kaggle, 銅 1

話す内容テーマバイアスのあるデータを IPW で補正して Uplift Modeing をやってみたよ TL;DR Uplift

参考資料仕事で始める機械学習岩波データサイエンス vol.03 4

実装について⾃作ライブラリ pycalf を作りました今回の実装については上記のライブラリにまとまっています 5

ToC . Uplift Modeling による介⼊効果の最⼤化 . Uplift Modeling の弱点 .

Uplift Modeling による介⼊効果の最⼤化 7

Uplift Modeling の⽬的何らかのマーケティング施策を想定する右図のような四象限を仮定する Uplift Modeling では、介⼊することでCVする群である「説得可能」

ABテストを通じたUplift Modelingの⼿順(1/7) ABテストを⾏い、以下のデータを取得する X: 特徴量, Z: 介⼊有無 (0 or 1),

ABテストを通じたUplift Modelingの⼿順(2/7) Z==0, Z==1 でデータを分けるつまり介⼊有無でデータを分割する 10

ABテストを通じたUplift Modelingの⼿順(3/7) Z==0, Z==1 ごとのモデルを作成 11

ABテストを通じたUplift Modelingの⼿順(4/7) 同様の検証データに対して作成したモデで予測 12

ABテストを通じたUplift Modelingの⼿順(5/7) 予測値からUplift Score と Lift を取得 Uplift_Score = treat_proba/control_proba

ABテストを通じたUplift Modelingの⼿順(6/7) AUUC でモデルの評価を⾏う⻘い線が介⼊した場合左からUpliftScoreが⾼い順に介⼊効果を積み上げている曲線が下ぶれてくるあたりから天邪⻤が含まれてくる 14

ABテストを通じたUplift Modelingの⼿順(7/7) UpliftScoreでソートしたLiftの累積和が最⼤値になるポイントを介⼊閾値に決定 AUUCの横軸をデータ数からUpliftScoreに変える UpliftScore = 1.1 あたりが最も介⼊効果が⾼

Uplift Modeling の弱点 ABテストを⾏ったデータが必要ということ（システム構成が複雑だとか？ユースケースあるの？とかは置いてといて） 16

Uplift Modeling が仮定していること ABテストのより得られた反実仮想のデータを学習する 17

バイアスをIPWで補正介⼊有無により特徴量に偏りが⽣じる場合、反実仮想のデータが⼿に⼊らないそこで、IPWを使えばバイアスを補填できるのではないかと考えた 18

傾向スコアの求め⽅特徴量から介⼊有無を予測するモデルを作成そのモデルの予測値を傾向スコアとするイメージ図 20

IPWのイメージ図引⽤: 医学統計セミナーアドバンスコース統計的因果推論と傾向スコア 21

IPW で Uplift Modeling の弱点を補填⽴ち戻ると、バイアスのあるデータで Uplift Modeling がしたい

重み付けモデルのイメージ図移⾏の⼿順は通常のUplift Modelingと同じ 23

バイアスを補填した Uplift Modeling の結果それっぽいAUUCが出てくることが確認できた。曲線のガタツキはデータ量によるものなのでデータが少ないときは注意が必要詳しい実装はこちら 24

IPWの弱点分類精度が⾼すぎる場合、以下のようなことが起こる極端な重み付け同質のデータが存在しない詳しくは岩波DS vol.03 で 25

積み残しモデルの検証が不⼗分意図した振る舞いなのかを検証するのが困難で、 ABテストの場合とバイアスがある場合のモデルの⽐較をしたいが単純には⽐較できない検証の⽅法についてを真⾯⽬に考える必要がある 26

おまけ実装はpycalfのexampleにあります傾向スコアを利⽤しない⼿法として Uber が開発していた causalML がある meta-learner や causal-tree

おわり 29