Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Gateway Talk vol.4 分析案件をやり始めたときに陥っていたことの共...
Search
knagano
November 21, 2019
Business
0
2.8k
Data Gateway Talk vol.4 分析案件をやり始めたときに 陥っていたことの共有と対策 / DataGatewayTalk-Vol4-nagano
分析案件をやり始めたときに、自分の頭でちゃんと考えて分析ができていなかったのでどうやって対策したか
knagano
November 21, 2019
Tweet
Share
More Decks by knagano
See All by knagano
Notionによる情報収集と活かし方 / How to collect and utilize information by Notion
knagano1020
10
20k
正しく機能するOKR運用方法とは / The OKR operation method to function properly
knagano1020
1
140
Other Decks in Business
See All in Business
爆速入力が可能に! つよ〜い味方 Aqua Voice
panchaaan_2
0
200
生成AI専任営業が語るre:Inventで発表された生成AIアップデート情報
suzakiyoshito
0
240
Outputをもう一歩先へ 〜あなたの現在地に合わせた、量や質など「もう一歩先の」Output〜
amixedcolor
2
280
2025年 知財10大ニュース と 2026年 知財予測レポート for #スナックのざき
otsubo
0
580
Очарование и разочарование при создании стратегии
alexanderbyndyu
0
260
未経験PdM40%のプロダクトマネージャー組織を作った過程でわかった再現性について
numashi
1
720
株式会社IB_採用資料
hokenbo
0
160
メドピアグループ紹介資料
medpeer_recruit
10
140k
【ニトエル株式会社】会社紹介資料
hr_nitoel
0
110
三井物産グループのデジタル証券〜千代田区・レジデンス〜徹底解説セミナー
c0rp_mdm
PRO
0
1.8k
VISASQ: ABOUT US
eikohashiba
15
540k
なぜ、あのPdMは「時間がない」と言わないのか? ~元エンジニアPdMが実践する「ドキュメント化 x MCP」の全貌~
sam8helloworld
0
120
Featured
See All Featured
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
120
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
Skip the Path - Find Your Career Trail
mkilby
0
28
Statistics for Hackers
jakevdp
799
230k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
130
The agentic SEO stack - context over prompts
schlessera
0
570
The #1 spot is gone: here's how to win anyway
tamaranovitovic
1
880
Accessibility Awareness
sabderemane
0
28
Crafting Experiences
bethany
0
24
Discover your Explorer Soul
emna__ayadi
2
1k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.2k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Transcript
分析案件をやり始めたときに 陥っていたことの共有と対策 ⻑野 克也 (@chitose_ng)
後⽇、スライドのアップロードをします。 Caution □□□□□□□□□□ 0/100%
DataGatewayをくぐり始めた⼈ DataGatewayをくぐろうとする部下がいる⼈ Target □□□□□□□□□□ 1/100%
Company TVISION INSIGHTS株式会社 Work - テレビの視聴態度のR&D - クライアントKPIとの関係性調査 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ Other
チトセナガノ(@chitose_ng) まずは蝋の翼から Tableauデータ分析 ~実践から活⽤まで~ プロフィール □□□□□□□□□□ 2/100%
Company TVISION INSIGHTS株式会社 業界的に新領域のデータを 提供する会社 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ プロフィール NO PRESENTATION ?/100%
モニターのリビングに⼈体認識技術を組み込んだ機械を設置し、 視聴態度データを取得 NO PRESENTATION ?/100%
⾃動で顔認識・識別 どう観ているのか (視聴体制) 誰が観ているのか (個⼈特定) テレビの注視度を 計測する NO PRESENTATION ?/100%
業界的に、今までは「テレビがついているか」のデータから KPIへの影響を⾒ていた NO PRESENTATION ?/100%
「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる NO PRESENTATION ?/100%
「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる 業界的に未解明の部分が多いので、 どう使えるかのR&Dと クライアントのKPIとの関係を調査/分析 仕事内容 NO PRESENTATION ?/100%
2015 04 2017 09 2019 01 Today SQLおじさん (データ抽出の⼈/ データアーキテクト)
R&D クライアント分析 2年半 1年半 BI屋 10ヶ⽉ ʘίίͷؾ͖ʗ 経歴 □□□□□□□□□□ 6/100%
分析案件をやり始めたときに よくあった会話
こんな感じのモデル考えてます! ◦◦という手法もあると思うけど なんでこの手法なの? な、なんとなくっす。。。 本当にあったアレな会話1 ʘ ্ ࢘ Ͱ ͢
ʗ ▪□□□□□□□□□ 10/100%
こんな感じのモデル考えてます! このモデル式だと☓☓に△△って仮定を 置いてるってことだよね? あっ、はい多分そうっす。 (言われるまで意識してなかったけど) 本当にあったアレな会話2 ʘ ্ ࢘ Ͱ
͢ ʗ ▪□□□□□□□□□ 12/100%
何故なんとなく分析をしてしまうのか︖ Topic
何故なんとなく分析をしてしまうのか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない ▪□□□□□□□□□ 16/100%
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない ▪▪□□□□□□□□ 20/100% 何故なんとなく分析をしてしまうのか
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない テキトーにそれっぽい⼿法を選ぶ理由 テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由 ▪▪□□□□□□□□
26/100% 何故なんとなく分析をしてしまうのか
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーにそれっぽい⼿法を選ぶ理由 ▪▪▪□□□□□□□ 35/100%
何故なんとなく分析をしてしまうのか
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする ▪▪▪□□□□□□□ 37/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ ▪▪▪▪□□□□□□ 40/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ ▪▪▪▪□□□□□□ 42/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ ▪▪▪▪□□□□□□ 45/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ 類似⼿法との⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ 要するに、論⽂のような読み⽅で理解・学習
Random Forestと Gradient Boosting Decision Treeの違いを ⾔えますか︖ Example ▪▪▪▪▪□□□□□ 50/100%
何故モデルをなんとなく作るか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由
▪▪▪▪▪□□□□□ 57/100%
選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 60/100%
説明ができない部分は、 考えていない部分 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 62/100%
説明ができない部分は、 考えていない部分 この思考を繰り返すと、 考えて要素を⼊れられるようになる 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 67/100%
次のモデルへの問いは何か Example ▪▪▪▪▪▪▪□□□ 70/100%
CM認知度 = α CM本数 + β CM種類ダミー + 定数 Example
▪▪▪▪▪▪▪□□□ 72/100%
Example OLSで解くので正規分布 CM認知度 = α CM本数 + β CM種類ダミー +
定数 ▪▪▪▪▪▪▪□□□ 74/100% どういう仮定を置いたモデル式なのか
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪□□□ 78/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 82/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布 CM種類が別でも 効果が同じ
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 83/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 87/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖ 何を問えばいいのかは慣れが必要。 はじめは上司に⼿伝ってもらおう。
今⽇のまとめ Today’s Summary ▪▪▪▪▪▪▪▪▪□ 94/100%
⾃分の頭でちゃんと考えた分析をするためには Today’s Summary 1 ⼿法の違いを意識して学習し、 2 何について考えればいいのか把握し思考することで、 3 ⾃分が考えたあらゆる選択に対して、説明可能にする。 ▪▪▪▪▪▪▪▪▪□
95/100%
▪▪▪▪▪▪▪▪▪▪ 100/100%