Maciej Jaskowski and Szymon Jaroszewicz. Uplift modeling for clinical trial data. In ICML Workshop on Clinical Data Analysis, Vol. 46, pp. 79–95, 2012. 31 会員 A 300円 ? ? B ? 200円 ? C 250円 ? ? 会員 A 300円 ? 600円 B ? 200円 −400円 C 250円 ? 500円 観測データからは介入有無 での売上差は入手不可能 学習データ中の T i =1 の比率 左表はp=0.5で計算 売上差の不偏推定となるよ うに、r i を目的変数として予 測モデルを1つ学習 配信の 売上観測値 非配信の 売上観測値 配信するかどうかの{0,1}
• 優先度算出モデルの学習 ◦ 会員 i の特徴量をもとに の推定値 を 推論 ◦ Si(Ti)>0のデータを用いて優先度 を算出 ◦ 優先度 r i を会員 i の特徴量をもとに学習 • 優先度算出モデルによる推論 ◦ 会員 i の特徴量をもとに r i の推定値を算出 配信観測売上 非配信予約確率 ー 配信予約確率 × 非配信観測売上 ∝ 特定の仮定のもとでの期待値が ρ i に対する不偏推定量に
操作領域数が多い操作前利益率範囲 r の上下限に重みをつけ、単調性・ 凹性・凸性の制約のもとで誤差が最小となるよう操作範囲を修正 操作前利益率範囲 r の操作領域数 操作前利益率範囲 r の操作後利益率上限の 修正値・算出値 〃下限の 修正値・算出値 上下限の算出値との重み付き2乗誤差最小化 価格操作上限の単調性 価格操作下限の単調性 価格操作上限の凹性 価格操作下限の凸性 価格操作上限の推定値は下限の推定値より大 ① ② ③ 43