Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Gateway Talk vol.4 分析案件をやり始めたときに陥っていたことの共...
Search
knagano
November 21, 2019
Business
0
2.7k
Data Gateway Talk vol.4 分析案件をやり始めたときに 陥っていたことの共有と対策 / DataGatewayTalk-Vol4-nagano
分析案件をやり始めたときに、自分の頭でちゃんと考えて分析ができていなかったのでどうやって対策したか
knagano
November 21, 2019
Tweet
Share
More Decks by knagano
See All by knagano
Notionによる情報収集と活かし方 / How to collect and utilize information by Notion
knagano1020
10
19k
正しく機能するOKR運用方法とは / The OKR operation method to function properly
knagano1020
1
130
Other Decks in Business
See All in Business
Expedi𝓪®️ USA Contact Numbers: Complete 2-0-2-5 Support Guide
travelhupsupport
0
130
なぜ転職しても「このままでいいのか」が消えないのか_キャリアの価値観レポート2025
thosoya
1
320
15 Quick Ways to Connect: How to Reach a Human at QuickBooks Payroll Support
tonotej274
0
130
Feedback in Action
lycorptech_jp
PRO
1
340
LW_brochure_engineer
lincwellhr
0
34k
コミュニティでUGCを増やす技術
chlorine0528
1
290
30枚でわかるフォトラクション
photoruction
0
170
Automating myself out of an unloved project with Python, n8n and Telegram
switowski
1
160
【全ポジション共通】㈱エグゼクション/会社紹介資料
exe_recruit
1
1.3k
LW_brochure_business
lincwellhr
1
60k
Sales Marker Culture book
salesmarker
PRO
36
60k
株式会社RIT採用候補者向け会社紹介資料
rit_inc
0
12k
Featured
See All Featured
BBQ
matthewcrist
89
9.7k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
The Cult of Friendly URLs
andyhume
79
6.5k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
138
34k
Gamification - CAS2011
davidbonilla
81
5.4k
Visualization
eitanlees
146
16k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.6k
The Straight Up "How To Draw Better" Workshop
denniskardys
235
140k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.3k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
126
53k
Transcript
分析案件をやり始めたときに 陥っていたことの共有と対策 ⻑野 克也 (@chitose_ng)
後⽇、スライドのアップロードをします。 Caution □□□□□□□□□□ 0/100%
DataGatewayをくぐり始めた⼈ DataGatewayをくぐろうとする部下がいる⼈ Target □□□□□□□□□□ 1/100%
Company TVISION INSIGHTS株式会社 Work - テレビの視聴態度のR&D - クライアントKPIとの関係性調査 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ Other
チトセナガノ(@chitose_ng) まずは蝋の翼から Tableauデータ分析 ~実践から活⽤まで~ プロフィール □□□□□□□□□□ 2/100%
Company TVISION INSIGHTS株式会社 業界的に新領域のデータを 提供する会社 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ プロフィール NO PRESENTATION ?/100%
モニターのリビングに⼈体認識技術を組み込んだ機械を設置し、 視聴態度データを取得 NO PRESENTATION ?/100%
⾃動で顔認識・識別 どう観ているのか (視聴体制) 誰が観ているのか (個⼈特定) テレビの注視度を 計測する NO PRESENTATION ?/100%
業界的に、今までは「テレビがついているか」のデータから KPIへの影響を⾒ていた NO PRESENTATION ?/100%
「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる NO PRESENTATION ?/100%
「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる 業界的に未解明の部分が多いので、 どう使えるかのR&Dと クライアントのKPIとの関係を調査/分析 仕事内容 NO PRESENTATION ?/100%
2015 04 2017 09 2019 01 Today SQLおじさん (データ抽出の⼈/ データアーキテクト)
R&D クライアント分析 2年半 1年半 BI屋 10ヶ⽉ ʘίίͷؾ͖ʗ 経歴 □□□□□□□□□□ 6/100%
分析案件をやり始めたときに よくあった会話
こんな感じのモデル考えてます! ◦◦という手法もあると思うけど なんでこの手法なの? な、なんとなくっす。。。 本当にあったアレな会話1 ʘ ্ ࢘ Ͱ ͢
ʗ ▪□□□□□□□□□ 10/100%
こんな感じのモデル考えてます! このモデル式だと☓☓に△△って仮定を 置いてるってことだよね? あっ、はい多分そうっす。 (言われるまで意識してなかったけど) 本当にあったアレな会話2 ʘ ্ ࢘ Ͱ
͢ ʗ ▪□□□□□□□□□ 12/100%
何故なんとなく分析をしてしまうのか︖ Topic
何故なんとなく分析をしてしまうのか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない ▪□□□□□□□□□ 16/100%
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない ▪▪□□□□□□□□ 20/100% 何故なんとなく分析をしてしまうのか
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない テキトーにそれっぽい⼿法を選ぶ理由 テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由 ▪▪□□□□□□□□
26/100% 何故なんとなく分析をしてしまうのか
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーにそれっぽい⼿法を選ぶ理由 ▪▪▪□□□□□□□ 35/100%
何故なんとなく分析をしてしまうのか
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする ▪▪▪□□□□□□□ 37/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ ▪▪▪▪□□□□□□ 40/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ ▪▪▪▪□□□□□□ 42/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ ▪▪▪▪□□□□□□ 45/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ 類似⼿法との⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ 要するに、論⽂のような読み⽅で理解・学習
Random Forestと Gradient Boosting Decision Treeの違いを ⾔えますか︖ Example ▪▪▪▪▪□□□□□ 50/100%
何故モデルをなんとなく作るか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由
▪▪▪▪▪□□□□□ 57/100%
選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 60/100%
説明ができない部分は、 考えていない部分 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 62/100%
説明ができない部分は、 考えていない部分 この思考を繰り返すと、 考えて要素を⼊れられるようになる 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 67/100%
次のモデルへの問いは何か Example ▪▪▪▪▪▪▪□□□ 70/100%
CM認知度 = α CM本数 + β CM種類ダミー + 定数 Example
▪▪▪▪▪▪▪□□□ 72/100%
Example OLSで解くので正規分布 CM認知度 = α CM本数 + β CM種類ダミー +
定数 ▪▪▪▪▪▪▪□□□ 74/100% どういう仮定を置いたモデル式なのか
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪□□□ 78/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 82/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布 CM種類が別でも 効果が同じ
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 83/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 87/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖ 何を問えばいいのかは慣れが必要。 はじめは上司に⼿伝ってもらおう。
今⽇のまとめ Today’s Summary ▪▪▪▪▪▪▪▪▪□ 94/100%
⾃分の頭でちゃんと考えた分析をするためには Today’s Summary 1 ⼿法の違いを意識して学習し、 2 何について考えればいいのか把握し思考することで、 3 ⾃分が考えたあらゆる選択に対して、説明可能にする。 ▪▪▪▪▪▪▪▪▪□
95/100%
▪▪▪▪▪▪▪▪▪▪ 100/100%