Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
レポート化の落とし穴
Search
けんご
August 18, 2017
Research
0
120
レポート化の落とし穴
けんご
August 18, 2017
Tweet
Share
More Decks by けんご
See All by けんご
いいたいことちゃんという
tkengo
0
370
スタートアップで役割をまっとうする技術
tkengo
0
130
TableauやLookerだけじゃない!QuickSightで作る顧客向けダッシュボード
tkengo
1
210
toypoインフラリプレースのお話
tkengo
0
16
機械学習を始めるための第一歩
tkengo
0
230
PHP and sometimes Machine Learning
tkengo
3
1.1k
機械学習と数学とプログラマのための数学勉強会
tkengo
0
540
CNNによるテキスト分類
tkengo
1
47k
指数の裏側
tkengo
1
370
Other Decks in Research
See All in Research
機械学習でヒトの行動を変える
hiromu1996
1
380
Geospecific View Generation - Geometry-Context Aware High-resolution Ground View Inference from Satellite Views
satai
2
130
LiDARとカメラのセンサーフュージョンによる点群からのノイズ除去
kentaitakura
0
180
研究の進め方 ランダムネスとの付き合い方について
joisino
PRO
56
20k
ニューラルネットワークの損失地形
joisino
PRO
36
18k
20240918 交通くまもとーく 未来の鉄道網編(こねくま)
trafficbrain
0
340
Composed image retrieval for remote sensing
satai
2
130
129 2 th
0325
0
250
秘伝:脆弱性診断をうまく活用してセキュリティを確保するには
okdt
PRO
4
770
論文紹介: COSMO: A Large-Scale E-commerce Common Sense Knowledge Generation and Serving System at Amazon (SIGMOD 2024)
ynakano
1
210
MetricSifter:クラウドアプリケーションにおける故障箇所特定の効率化のための多変量時系列データの特徴量削減 / FIT 2024
yuukit
2
140
第 2 部 11 章「大規模言語モデルの研究開発から実運用に向けて」に向けて / MLOps Book Chapter 11
upura
0
430
Featured
See All Featured
The Cost Of JavaScript in 2023
addyosmani
45
7k
Done Done
chrislema
181
16k
How to train your dragon (web standard)
notwaldorf
88
5.7k
GraphQLとの向き合い方2022年版
quramy
44
13k
Raft: Consensus for Rubyists
vanstee
137
6.7k
How to Think Like a Performance Engineer
csswizardry
22
1.2k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
17
2.3k
Speed Design
sergeychernyshev
25
670
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
520
Typedesign – Prime Four
hannesfritz
40
2.4k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
26
1.5k
Transcript
@tkengo レポート化の落とし穴 2017.08.17 第2回 意思決定のためのデータ分析勉強会
自己紹介 立石 賢吾 LINE Fukuoka株式会社 データ分析チーム RubyとJavaScriptが好きです Twitter Github Blog
@tkengo @tkengo http://tkengo.github.io/
自己紹介 やさしく学ぶ 機械学習を理解するための数学の基本 2017/9/20(水) より Amazon で発売開始予定 https://www.amazon.co.jp/dp/4839963525/ 読んでみたい人、興味がある人、もしいたらこのあとtkengoまで。 可能であれば発売後に献本差し上げますので是非ブログやSNSなどで
感想を書いて広めてください!
閑話休題
データ分析について 能動的に、自ら動いてアクションを提示 受動的に、依頼を受けて現状分析
データ分析について 能動的に、自ら動いてアクションを提示 受動的に、依頼を受けて現状分析 今日は ここの話
分析サイクル スポット 分析 分析結果 理解 定常化 (レポート化) 分析依頼
分析サイクル スポット 分析 分析結果 理解 定常化 (レポート化) 分析依頼 施策の実施した際の効果測定や、次の施策の実施のために分析依頼をもらう
分析サイクル スポット 分析 分析結果 理解 定常化 (レポート化) 分析依頼 基本的にSQLで結果を集計して、Excelなどで可視化 スポットなので多少重いクエリが流れるとしても、待つのは自分なので許容範囲
分析サイクル スポット 分析 分析結果 理解 定常化 (レポート化) 分析依頼 現状理解及び結果を加味して次回施策や新機能の考察 または追加の分析案件があればさらに対応する
分析サイクル スポット 分析 分析結果 理解 定常化 (レポート化) 分析依頼 分析結果が今後も有用であればTableauなどのツールでレポート化 基本的には企画者やマーケターが定期的にみるので表示が1分とかかかるとNG
重いクエリに対してはレポート化のためにETL必須
依頼されたことを そのままやればいい?
いきなり完璧なレポートを 求めてくる 問題点1
問題点1 •サービスが始まる前から求められるレポート化 •まあどうなるかはわかんないけど・・・ •初動を見たいから・・・ •最初から数字が取れてた方が便利だし・・・ •母数が少なくあまり動きが無いのにレポート化
すべての数字を完璧に 取れるように求めてくる 問題点2
問題点2 •KPI多すぎ問題 •クリック数 / クリックUU / 購入数 / 購入UU /
PU / 金額合計 / ARPU / ARRPU •他 ◦◦数 / ◦◦UU などが数十個 •軸多すぎ問題 •日付 / 時間 / 性別 / デバイス / 有料・無料 / 商品カテゴリ / 商品ID / 他 •すべて優先度高問題 •優先度とは •ハイハイデスヨネー
うまく伝わらない企画者の想い 問題点3
問題点3 •いつから企画者が自分の頭の中の全てを僕達に話してくれている と錯覚していた? •10の伝えたいことのうち7か8だけ伝わればいい方 •5しか伝わらないこともある •頭の中を資料にアウトプットしてくれても、そのアウトプット自体が頭の 中と間違っていることも(!?) •想いがずれていると可視化する際の障害にもなる
全部そのままやると 大変なことに…
レポート化の落とし穴 •そのレポート本当に必要? •軸とKPI多すぎて見にくすぎでは? •母数が数十のデータに対してそんなに複雑な軸いる? •あなた分析者に対するコスト意識ありますか? •夢が大きすぎない?
レポート化の落とし穴 •結局は依頼を受けるにしても自ら考える必要はある •サービスの性質と施策の意図を確実に理解する •自分も企画者になったつもりで自分が欲しいものを考える •現状分析で満足しない。アクションに活かせない分析は無価値
コミュニケーション大事
おわり
宣伝スライド やさしく学ぶ 機械学習を理解するための数学の基本 2017/9/20(水) より Amazon で発売開始予定 https://www.amazon.co.jp/dp/4839963525/ 読んでみたい人、興味がある人、もしいたらこのあとtkengoまで。 可能であれば発売後に献本差し上げますので是非ブログやSNSなどで
感想を書いて広めてください!