Upgrade to Pro — share decks privately, control downloads, hide ads and more …

実験デザイン入門

 実験デザイン入門

Repro で社内のイベントで実験デザインについて話した内容の公開版です。
社内向けイベントではこの内容に加えて、実務に近い状況で一通り実験デザインから結果の解釈まで行ったのと、実例を用いて議論を行いました。実例を用いて議論するという点が特に重要だったと感じています。

スライドで紹介している書籍は 生命科学の実験デザイン[第4版] です https://www.amazon.co.jp/dp/481580950X

Asei Sugiyama

June 10, 2020
Tweet

More Decks by Asei Sugiyama

Other Decks in Science

Transcript

  1. ⾃⼰紹介 杉⼭ 阿聖 Software Engineer @ Repro AI Labs TensorFlow

    コントリビューター TFX : Issue ⽴てたり PR ⽴てたり docs-l10n : 翻訳 & レビュー 機械学習図鑑 共著
  2. なぜ実験デザインについて話すのか? 「統計わからん」は様々な原因がある . 統計処理がわからん : 各種検定や信頼区間が難しい . データを扱う業務をどう進めればいいかわからない . 収集したデータをうまく解釈できない

    統計処理は各種ツール (Excel, Spreadsheet) が助けてくれる データを扱う業務の進め⽅については情報がなかなかない A/B テスト: 1 因⼦完全ランダム化デザイン、因果がわかる A/B テストを⾏うまでに何を⾏うのかは⾃分が決める必要がある
  3. レポートの項⽬例 項⽬ 記述内容 計画時に記述 概要 まとめ、要約 背景 課題の背景、なぜこれを⾏うのかの経緯 ✓ ⽬的

    検証の⽬的、解決したい課題 ✓ 検証内容 計測する指標、成功/失敗のしきい値、仮説 ✓ 結果 得られた結果、グラフ、表 考察 結果の解釈・考察
  4. 作業仮説って? 実際にデータの分析を⾏うにあたり、とりあえず⽴てておく仮説 (理論)仮説 : アプリを利⽤するユーザーの⽅が CV しやすい 作業仮説 : 3⽇以内にアプリを起動した⼈のほうが、アプリを起動して

    いない⼈よりも CVR が⾼い 作業仮説は正しかったときと、正しくなかったときのことを考えておく 検定を⾏った結果、相関があるとは⾔えなかったら追加で何が分かっ ているといいだろうか? 先週末の⾏動が⼤きく影響していないだろうか? 「良い」を「Aの⽅がBより良い」と書き換えておく
  5. 4. 実験 A/B テストを⾏う場合、典型的には次のうちのどちらかになる 仮説検証 : ⽴てた仮説の検証を⾏いたい モニタリング : ⾏っている施策が有効かどうか監視したい

    仮説検証を⾏いたい場合では、最速で結果を出せると良い 例えば、 A:B = 50:50 の割合で実施する 仮説検証フェーズと、施策実施フェーズを明確に分ける モニタリングを⾏いたい場合では、逸失利益のことを考える 例えば Treatment:Control = 90:10 として実施する