Upgrade to Pro — share decks privately, control downloads, hide ads and more …

マクロからミクロへMMMとアップリフトモデルによる広告効果測定

 マクロからミクロへMMMとアップリフトモデルによる広告効果測定

※webセミナーの講演資料(2025年7月30日)
※その他概要はこちら→https://techplay.jp/event/983194

Video

More Decks by The Japan DataScientist Society

Transcript

  1. JINSのご紹介 •ビジネスの内容 • メガネ・サングラスの企画、製造、販売を一貫して行う アイウエアカンパニー • 全国および海外の店舗、そしてオンラインストアを通じて、 定番からトレンドのアイウエアを手頃な価格で提供 •私たちのビジョン:Magnify Life

    - まだ見ぬ、ひかりを • 私たちは、まだ誰も知らない可能性にひかりを当て、世界中の 人々の生き方そのものを豊かに拡げることを目指している • このビジョンを実現するため、データとテクノロジーの活用を 経営の重要な柱の一つと位置づけている 2
  2. 北海道 店舗 17 東北 店舗 35 関東 店舗 221 中部

    店舗 78 関西 店舗 71 中国 店舗 23 四国 店舗 13 九州・沖縄 店舗 48 中国 店舗 167 北米 店舗 4 フィリピン FC 香港 店舗 9 台湾 店舗 61 49 5 店舗 国内店舗数 24 1 店舗 海外店舗数 店舗数 3 ※2024年8月末時点
  3. 社員数 店舗 本部 275名 4,351名 40.3% 男性 女性 65〜69 60〜64

    55〜59 50〜54 45〜49 40〜44 35〜39 30〜34 25〜29 20〜24 15〜19 男 女比 キ ャリ ア の割 合 (歳) ※準社員・パート含む ※準社員・パート含む ※準社員・パート含む ※本部 正社員のみ 中途入社 76.4% 23.6% 新卒入社 社 員の年齢 社 員数 本部 店舗 59.7% 0% 1% 7% 15% 29% 26% 13% 5% 2% 3% 0… 3% 25% 24% 19% 16% 8% 3% 1% 0% 0% 0% 4 ※2024年8月末時点
  4. 「見た目の効果」の罠:比較方法で結果は変わる 背景設定 広告効果を正しく測る難しさを検証するため 「トレンド」「季節性」「真の広告効果(25)」を 含むシミュレーションデータを生成 実験結果 ① 直前比較 広告期間の「直前の期間」と売上を比較 →

    元々の上昇トレンドを広告の効果と誤って取り込ん でしまい、広告効果を過小に評価した ② 前年比較 「1年前の同じ期間」と比較したところ、効果は13 → 前年のベース売上が(コロナ影響で)たまたま低か ったため、広告効果を過大に評価してしまった 結論 単純な期間比較では、比較対象の選び方次第で広告効 果の評価が大きく歪んでしまう 19
  5. エリアABテストのシミュレーション実験 33 実験1:TGのみ 実験2:TGとCTL 実験1と実験2を100回繰り返す 広告効果:真のパラメータ 平均 2.00(中心の位置) 分散 1.00(ばらつき)

    平均値は、実験1と実験2では差がない 分散は、実験2の方が小さい 平均のシミュレーション結果 分散のシミュレーション結果 分散の推定 分散の分散 実験1 1.00 0.0051 実験2 1.00 0.0021 平均の推定 平均の分散 実験1 2.01 0.14 実験2 1.99 0.05
  6. エリアABテストが広告効果の推定精度を向上させる理由 37 エリアABテストありの優位性 • 全国共通のトレンドや季節性は、広告実施エリアと非実施エリアの両方に同じように影響する • 広告が実施されていないコントロール群のデータを使って、これらの共通要因の影響を正確に学習 し、その効果(γ)を分離することができる • その結果、広告効果を示す交互作用項と、共通要因との間の相関は大幅に低下する

    エリアABテストは、広告効果と全国共通のトレンドや季節性といった交絡因子(Confounders)との 間の多重共線性を軽減させる効果がある 結果、モデルは広告の純粋な効果をクリーンに分離できるようになり、広告効果パラメータの推定量の 分散が減少し、推定の精度が数学的に向上する
  7. 検知できる広告効果の限界を知る 39 1. テスト1:広告効果がないときに、誤って広告があると検出しないか ノイズを与えないデータ(TV CMの効果がないデータ)に対し、仮想の広 告期間を与えた場合に、広告効果がほぼ0であることを確認する 2. テスト2:広告効果を与えたときに、広告の効果量を正しく検知できるか 1%,

    2%, 3%, ..., x%のノイズを仮想の広告期間に与え検知できることを 確認する(推定可能な広告効果の限界値を知る) (例)事前のテストで検知できるリフトが5%程度必要だと分かった → 想定される施策効果が1%程度である場合、モデルを作成してもノイズとみ なされるリスクが高い
  8. 粒度 金額 コスト(傾きは小さい) 施策効果(傾きは大きい) マス one to one セグメント 43

    セグメントを細かくするをする上での重要なポイント 1. 施策対象者が多い - カスタマが少ないとレバレッジが効かない 2. カスタマを細分化した時のコスト - ウェブ広告では、カスタマの粒度を細かくしてもコストはそれほど増えない - one to oneに近い状態で、施策を評価をできれば、施策のリターンは効率的である
  9. 45 ABテストを用いた効果測定の課題 • 変数を増やすとセグメントが膨大になる • 評価してみると結果がおかしい - ABテストの限界 27% 20%

    セグメントA 未付与者の CVR 付与者の CVR セグメントを細かくしすぎ 人数が少ないセグメントが多発 10人中の 2人 11人中の 3人
  10. アップリフトモデリングの紹介 47 重要な4つのセグメント概念 説得可能層(The Persuadables) 施策を受け取った場合に購入確率が上昇する層 この層をターゲットにする 無関心層(The Sure Things)

    施策の有無にかかわらず購入する層 クーポンコストの無駄になる 離反層(The Lost Causes) 施策の有無にかかわらず購入しない層 クーポンコストの無駄になる 迷惑層(The Sleeping Dogs) 施策を受け取ると、むしろ購入しなくなる層 しつこい広告でブランドが嫌いになる → こんな人って本当に存在する?
  11. ロジスティック回帰モデル(2モデルアプローチ) 53 ステップ1:ロジスティック回帰を TG グループと CTL グループに対して それぞれモデル作成を作成する ステップ2:[ TG

    グループの予測確率 - CTL グループの予測確率 ]を行い、 その差分をアップリフトスコア、つまり、クーポン付与の効果と考える
  12. 機械学習モデル:SVMと決定木 55 • サポートベクターマシン (SVM) 顧客を分類する境界線を見つけるのが得意なモデル 特に、顧客の特徴量が多い場合に力を発揮する • 決定木 「もしAがYseで、かつBがNoなら…」のように、条件分岐を繰り返して顧客を分類するモデル

    結果が非常に分かりやすく、「説得可能層」がどのような顧客かを図で理解しやすいのが特徴 長所と短所 長所 • 顧客の属性と施策効果の間の、複雑で非線形な関係を捉えることができる • 一般的に、ロジスティック回帰よりも高い予測精度が期待できる 短所 • モデルがブラックボックスになりがちで、なぜそうなったかを説明するのが難しい • モデルがデータに過学習しやすく、未知のデータに対する精度が落ちることがある
  13. モデルの比較 61 • アップリフトモデルとして機械学習を用いるケースが多い • 実際に、モデルの予測能力だけで評価すれば、機械学習の精度は高いことが多い • 機械学習によって作られたモデルは、構造が複雑になっているため、なぜそういった予 測になるのか理由を説明することが難しい •

    機械学習を用いれば誰が購入予約をするかを精度高く予測することができるが、なぜそ の人が購入するのかは明らかにできない • たまたま施策効果が大きそうに見えていた顧客にクーポンを付与してしまい、 実際に は効果がほとんどなく、巨額の損失を生じさせるといったリスクもある
  14. 短期利益と長期的成長の両輪を回す 64 短期的な利益貢献 長期的な企業成長 施策の最適化(1-shotの積み重ね) 顧客体験(CX)の向上 個別のマーケティング施策の効果を最大化 し、直接的な利益を生み出す 顧客との良好な関係を築き、LTVを高める ことで、持続的な成長の土台を作る

    <具体例> • アップリフトモデリング • 広告効果測定(MMM) • 価格最適化 即効性があるが、効果は限定的・一過性 <具体例> • 顧客理解の深化 • ロイヤルティプログラムの分析 • ブランド価値の測定 効果の発現に時間がかかるが、 企業の根幹を支える
  15. まとめ 66 • 広告効果を測定するための2つの補完的なフレームワーク • MMMとアップリフトモデルの比較 - MMM 予算配分(例:テレビ vs

    デジタル)の意思決定に役立つ - アップリフトモデル 個々のユーザーに広告を表示すべきかどうかの判断に役立つ
  16. 67 各分析アプローチの長所と短所 分析アプローチ メリット(長所) デメリット(短所) 前後比較・昨対比較 ・手軽さ: 計算が非常に簡単で、 誰でもすぐに結果を出せる。 ・直感的:

    理解しやすい。 ・信頼性が極めて低い: トレンド、 季節性、競合など、あらゆるバ イアスの影響を受ける。 ・誤った意思決定: 見かけ上の効 果に騙され、判断を誤るリスク が非常に高い。 ランダム化比較試験 (RCT) ・最も信頼性が高い: 因果関係を 特定するゴールドスタンダード。 ・結果が明快: 施策の純粋な効果 をバイアスなく測定できる。 ・実施コストが高い: 特にマス広 告での実施は困難または不可能。 ・限定的: 特定の期間・クリエイ ティブの効果しか検証できない。 アップリフトモデル ・個人レベルの示唆: 「誰に効く か」を特定し、次の施策のROI を最大化できる。 ・顧客体験の向上: 迷惑層へのア プローチを避け、離反を防ぐ。 ・RCTデータが必須: モデル構 築のために、個人単位のRCTが 必要。 ・モデルの複雑性: 構築や解釈に 専門的な知識を要する。
  17. 68 各分析アプローチの長所と短所 分析アプローチ メリット(長所) デメリット(短所) エリアABテストMMM ・高い信頼性: RCTに近く、マス 広告の効果を高い精度で測定で きる。

    ・交絡因子の排除: 全国共通のト レンド等の影響を自然に排除で きる。 ・コントロールエリア選定の難 しさ: DIDの前提(平行トレンド 仮定)を満たす、売上傾向が酷 似したエリアを見つけるのが非 常に難しい。 ・実施の制約: 広告を放映しない エリアの確保が必要。 ・コスト: 通常のMMMより分 析・準備のコストがかかる。 MMM (通常の観察データ) ・網羅性: 複数のマーケティング 施策の効果を同時に評価できる。 ・比較的安価: 既存のデータのみ で分析が可能。 ・モデル依存: 交絡因子を全てモ デルで調整する必要があり、見 落としのリスクがある。 ・精度限界: あくまで統計的な調 整であり、RCTほどの信頼性は ない。