$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
最近のUplift Modeling手法にRでトライ
Search
hskksk
December 09, 2024
Technology
0
560
最近のUplift Modeling手法にRでトライ
Japan.R 2024のLTで使用したスライドです。
hskksk
December 09, 2024
Tweet
Share
Other Decks in Technology
See All in Technology
Edge AI Performance on Zephyr Pico vs. Pico 2
iotengineer22
0
140
ブロックテーマとこれからの WordPress サイト制作 / Toyama WordPress Meetup Vol.81
torounit
0
560
Power of Kiro : あなたの㌔はパワステ搭載ですか?
r3_yamauchi
PRO
0
100
学習データって増やせばいいんですか?
ftakahashi
2
320
EM歴1年10ヶ月のぼくがぶち当たった苦悩とこれからへ向けて
maaaato
0
270
re:Invent2025 コンテナ系アップデート振り返り(+CloudWatchログのアップデート紹介)
masukawa
0
360
エンジニアとPMのドメイン知識の溝をなくす、 AIネイティブな開発プロセス
applism118
4
1.2k
年間40件以上の登壇を続けて見えた「本当の発信力」/ 20251213 Masaki Okuda
shift_evolve
PRO
1
120
打 造 A I 驅 動 的 G i t H u b ⾃ 動 化 ⼯ 作 流 程
appleboy
0
290
文字列の並び順 / Unicode Collation
tmtms
3
570
Microsoft Agent 365 についてゆっくりじっくり理解する!
skmkzyk
0
220
[デモです] NotebookLM で作ったスライドの例
kongmingstrap
0
140
Featured
See All Featured
Producing Creativity
orderedlist
PRO
348
40k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
Balancing Empowerment & Direction
lara
5
800
Navigating Team Friction
lara
191
16k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
10
720
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
Embracing the Ebb and Flow
colly
88
4.9k
Thoughts on Productivity
jonyablonski
73
5k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.4k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.5k
Transcript
最近のUplift Modeling 手法にRでトライ Japan.R 2024 2024/12/7 保坂 桂佑
• 保坂桂佑(X: @free_skier) • ヘルスケアスタートアップでデータサイエンティストをしています • 趣味:スキー、インドカレーづくり、キーボード自作 • 著書(共著)に「Kaggleで勝つデータ分析の技術」があります 自己紹介
このLTで話すこと • Li, K., & Zhu, L. (2024, May). A
New Transformation Approach for Uplift Modeling with Binary Outcome で精度の良いUplift Modeling の新しい方法が提案された • 概要を紹介 • 簡単な実験結果を紹介
Uplift Modelingとは 統計的因果推論におけるConditional Average Treatment Effect(CATE) を求める手法 CATEは以下の式で表される ある特徴 Xi
= x を持つ対象への介入効果を推定する手法と言える
変数変換によるアプローチ アクション有無Yと介入有無Wに対する変数変換で求めたZ*を目的変数 とした回帰モデルを作ると、CATEを推定するモデルが作れる (pは傾向スコア) ケースごとのZ* の値
情報の無駄をなくす 前ページの方法では「介入しても来なかった」「介入しないで来なかった」が同じ扱 いだった 「介入しても来なかった」ことは、「介入しないで来なかった」ことよりは悪いので、 良し悪しの重みをつける方法が提案された A New Transformation Approach for
Uplift Modeling with Binary Outcome ケースごとのZ* の値
Cを変えるとどうなるか C=0は旧手法と同じ。Cを大きくすると、事例の評価がファジーになる
実験 • 介入効果がわかっている簡単なデータを作り、介入効果の推定精度 を比較 • 傾向スコアをロジスティック回帰で、介入効果の推定を線形回帰で実 施 ダミーデータのグラフィカルモデル ダミーデータを作るコード
結果 • Uplift Modelingの評価にはQini曲線とその下の面積を使う (ゲインチャートやAUCのようなものだと思ってください) • 元の方法よりもQini曲線下の面積が大きくなった(=高精度) • C=0.15の結果
Cをどんな値にすると精度がよくなるの? 精度を最大化するCがあるみたい 精度を 最大化するC
いつでも新手法のほうが精度いいの? • いろいろなシードのダミーデータで同じことを実験 • 旧手法の方が精度が良いこともあった。Cをチューニングするのが良さそう
まとめ • A New Transformation Approach for Uplift Modeling with
Binary Outcome で精度の良いUplift Modelingの新しい方法を紹介 • 簡単な実験で旧手法より精度が良くなることを確認 • データごとにCに最適値がありそう • データによっては旧手法(C=0)のほうが高精度の場合もある
ご清聴ありがとう ございました!