Upgrade to Pro — share decks privately, control downloads, hide ads and more …

白金鉱業Meetup_Vol.20 効果検証ことはじめ / Introduction to I...

Avatar for BrainPad BrainPad
September 18, 2025

白金鉱業Meetup_Vol.20 効果検証ことはじめ / Introduction to Impact Evaluation

2025年9月18日に実施した、白金鉱業 Meetup Vol.20@六本木(効果検証編)
での株式会社 ブレインパッド平井の登壇スライドです。

イベントURL
https://brainpad-meetup.connpass.com/event/365473/

Avatar for BrainPad

BrainPad

September 18, 2025
Tweet

More Decks by BrainPad

Other Decks in Science

Transcript

  1. アジェンダ 自己紹介 AB テ ス ト の 必 要 性

    ABテストの必要性 AB テ ス ト の 難 し さ ABテストの難しさ
  2. 3 ©BrainPad Inc. 自己紹介 平井 直知 ひらい なおあき ブレインパッド データサイエンティスト

    経済学研究科を修了(修士) 異質介入効果(CATE)の推定が修論のテーマ 昔は演劇でスタッフしてましたが、 今はからきしです 学生時代の愛用メジャー
  3. 6 ©BrainPad Inc. 効果検証とは 簡単な施策効果の測り方 時系列で比較 キャンペーンの参加者・非参加者で比較 施策後の売上 (4月) 施策前の売上

    (3月) 施策前後で 比較 会員全体 参加者 売上 5,000万円 非参加者 売上 2,000万円 施策参加で 比較
  4. 7 ©BrainPad Inc. 効果検証とは 簡単な施策効果の測り方 時系列で比較 キャンペーンの参加者・非参加者で比較 施策前の売上 (3月) 施策後の売上

    (4月) 施策前後で 比較 会員全体 参加者 売上 5,000万円 非参加者 売上 2,000万円 施策参加で 比較 誤った効果検証
  5. 9 ©BrainPad Inc. 施策前の売上 (3月) 施策がない場合の売上 (4月) 施策がある場合の売上 (4月) 効果検証のベースとなる考え方

    施策以外の要因が同質なものを比較対象に設定するのが原則 比べるのはこの二つ!!!
  6. 10 ©BrainPad Inc. ABテスト(RCT) 母集団を「介入を行う群」と「介入しない群」の二群にランダムに分け、比較 介入群 対照群 KPIを比較 KPIがXX%増加 施策ROIがY.YY

    介入群と対照群をランダムに割り振ることで、 介入群と対照群が同質となる ※同質=性質が同じ。ユーザの性別・年代・年 収などのデモグラ情報やサービスの利用頻度、 購買金額などに偏りが生じていない状態。
  7. 11 ©BrainPad Inc. ABテストをもう少し厳密に 効果検証を行う際には、「ユニット」「介入」「結果変数」の3つを定義する 介入の対象となる最小単位 • 会員ID • クッキー

    • 店舗 ユニットに対して何を行うか • メール送付 • ECサイト上のポップアップ • 店舗の棚割り変更 介入の効果を測る指標 • MAU(月当たりのアクティブユーザー数) • CVR • 売上金額 定義すべき項目 ユニット 介入 結果変数 𝑖で表記 𝑇𝑖 ∈ {0, 1}で表記 𝑌𝑖 で表記 特に、因果推論特有の記法として、 • 𝑌𝑖 1 : 𝑖の介入時の結果の値 • 𝑌𝑖 0 : 𝑖の未介入時の結果の値 よくある数式
  8. 12 ©BrainPad Inc. ABテストをもう少し厳密に ここまでの内容を数式で書くと 言葉での表現 数式での表現 平井に対する介入効果は 「介入した際の売上」ー「介入しない際の売上」 ユニット𝑖への介入効果は

    𝑌𝑖 1 − 𝑌𝑖 (0) 母集団を対象群と介入群にランダムに分け、 「介入群の平均値」と「対照群の平均値」の差から 平均処置効果(ATE)を推定 𝑌𝑖 1 , 𝑌𝑖 0 ⊥ 𝑇𝑖 を満たすようランダムに介入し、 𝐸 𝑌𝑖 1 と𝐸[𝑌𝑖 0 ]を推定し、 ATE = 𝐸 𝑌𝑖 1 − 𝐸[𝑌𝑖 0 ]を推定 だが、1ユニットに対し、 介入あり/なしの片方のみしか観測できず、 平井に対する介入効果は観測不能 だが、ユニット𝑖に対し、 𝑌𝑖 1 か𝑌𝑖 (0)の片方しか観測できず、 𝑌𝑖 1 − 𝑌𝑖 (0)は観測不能
  9. アジェンダ 自 己 紹 介 自己紹介 AB テ ス ト

    の 必 要 性 ABテストの必要性 ABテストの難しさ
  10. 18 ©BrainPad Inc. ABテストって意外と難しい ABテストの実施時に考慮すべき点は多い Plan Action • KPI設定 •

    サンプルサイズ設計 • 介入効果のモニタリング • 知見の蓄積 • 意思決定に繋げる報告力 Do Check • ランダム化されているかの検証 (AAテスト) • 介入ユニットと分析ユニットが違う 場合の対処 • 結果が出るまで時間がかかる • セグメント探索時の多重検定 • 同時期に他の施策が実施されていた • ガードレールメトリクスの設定 効果検証の PDCAサイクル Pl an D o Act ion Ch eck
  11. 20 ©BrainPad Inc. KPI設定の難しさ(2/2) 「商品の利益率」と「クーポンのコスト」を加味した、利益の増分を測るべき 元からある利益 原価 クーポンなしでも購入する人 クーポンなしでの利益 商

    品 の 売 値 人数 ※ 仮定1. クーポンによる単価の変化はないと仮定。仮定2. クーポンにより買わなくなる人はいない。 利益率 クーポンによる利益構造※ クーポンによる減益 元からある利益 原価 クーポンなしでも購入する人 (無駄打ち) クーポンによる 増益 原価 クーポンにより購入する人 (アップリフト)
  12. 22 ©BrainPad Inc. 介入ユニットと分析ユニットの違いの難しさ(2/2) 分析ユニットは「人」が理想だが、介入ユニットは「クッキー」になりがち ユニットの候補 ページ閲覧 クッキー 人 ページを閲覧の度に、

    ポップアップ掲出するかをランダム化 1st Party Cookieの粒度で ランダム化を行う 人を特定できないため、不可能 ログイン済みであれば、 人単位での介入も可能 介入のランダム化の容易さ 分析ユニットの妥当さ 基本的には人粒度だが、 同じ人が複数ブラウザを利用すれば クッキーが異なる 購入の有無は人単位 ページ閲覧が適当なケースを 思いつかない…