Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Gateway Talk vol.4 分析案件をやり始めたときに陥っていたことの共...
Search
knagano
November 21, 2019
Business
0
2.8k
Data Gateway Talk vol.4 分析案件をやり始めたときに 陥っていたことの共有と対策 / DataGatewayTalk-Vol4-nagano
分析案件をやり始めたときに、自分の頭でちゃんと考えて分析ができていなかったのでどうやって対策したか
knagano
November 21, 2019
Tweet
Share
More Decks by knagano
See All by knagano
Notionによる情報収集と活かし方 / How to collect and utilize information by Notion
knagano1020
10
19k
正しく機能するOKR運用方法とは / The OKR operation method to function properly
knagano1020
1
140
Other Decks in Business
See All in Business
Fintech landscape updated - Japan section
hakusansai
0
1.1k
センス・トラスト福利厚生
sensetrust
0
1.4k
Spice Factory Inc. Culture Deck
spicefactory
0
15k
【DearOne】Dear Newest Member
hrm
2
14k
アシスト 会社紹介資料
ashisuto_career
3
140k
Corporate Story (GA technologies Co., Ltd.)
gatechnologies
0
390
ペイジェント採用資料
paygent
0
23k
お客様から大量の質問は Slackで"真打エージェント"がお答えいたしましょう
kosakiteppei
0
1k
イクシアス株式会社 会社紹介資料
ixyas
0
2.6k
曖昧なLLMの出力をプロダクト価値へつなげる、要求の具体化と評価
zerebom
3
380
~モブ、まだいけるよな?~2025年をふりかえってみて_20251126
masakiokuda
0
140
キャンバスエッジ株式会社 会社説明資料
canvasedge
0
2.6k
Featured
See All Featured
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
Java REST API Framework Comparison - PWX 2021
mraible
34
9k
Music & Morning Musume
bryan
46
7k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.3k
GitHub's CSS Performance
jonrohan
1032
470k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.3k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.6k
Writing Fast Ruby
sferik
630
62k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
7.9k
Faster Mobile Websites
deanohume
310
31k
Transcript
分析案件をやり始めたときに 陥っていたことの共有と対策 ⻑野 克也 (@chitose_ng)
後⽇、スライドのアップロードをします。 Caution □□□□□□□□□□ 0/100%
DataGatewayをくぐり始めた⼈ DataGatewayをくぐろうとする部下がいる⼈ Target □□□□□□□□□□ 1/100%
Company TVISION INSIGHTS株式会社 Work - テレビの視聴態度のR&D - クライアントKPIとの関係性調査 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ Other
チトセナガノ(@chitose_ng) まずは蝋の翼から Tableauデータ分析 ~実践から活⽤まで~ プロフィール □□□□□□□□□□ 2/100%
Company TVISION INSIGHTS株式会社 業界的に新領域のデータを 提供する会社 ʘςϨϏͷࢹௌଶΛଌΔձࣾʗ プロフィール NO PRESENTATION ?/100%
モニターのリビングに⼈体認識技術を組み込んだ機械を設置し、 視聴態度データを取得 NO PRESENTATION ?/100%
⾃動で顔認識・識別 どう観ているのか (視聴体制) 誰が観ているのか (個⼈特定) テレビの注視度を 計測する NO PRESENTATION ?/100%
業界的に、今までは「テレビがついているか」のデータから KPIへの影響を⾒ていた NO PRESENTATION ?/100%
「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる NO PRESENTATION ?/100%
「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる 業界的に未解明の部分が多いので、 どう使えるかのR&Dと クライアントのKPIとの関係を調査/分析 仕事内容 NO PRESENTATION ?/100%
2015 04 2017 09 2019 01 Today SQLおじさん (データ抽出の⼈/ データアーキテクト)
R&D クライアント分析 2年半 1年半 BI屋 10ヶ⽉ ʘίίͷؾ͖ʗ 経歴 □□□□□□□□□□ 6/100%
分析案件をやり始めたときに よくあった会話
こんな感じのモデル考えてます! ◦◦という手法もあると思うけど なんでこの手法なの? な、なんとなくっす。。。 本当にあったアレな会話1 ʘ ্ ࢘ Ͱ ͢
ʗ ▪□□□□□□□□□ 10/100%
こんな感じのモデル考えてます! このモデル式だと☓☓に△△って仮定を 置いてるってことだよね? あっ、はい多分そうっす。 (言われるまで意識してなかったけど) 本当にあったアレな会話2 ʘ ্ ࢘ Ͱ
͢ ʗ ▪□□□□□□□□□ 12/100%
何故なんとなく分析をしてしまうのか︖ Topic
何故なんとなく分析をしてしまうのか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない ▪□□□□□□□□□ 16/100%
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない ▪▪□□□□□□□□ 20/100% 何故なんとなく分析をしてしまうのか
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない テキトーにそれっぽい⼿法を選ぶ理由 テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由 ▪▪□□□□□□□□
26/100% 何故なんとなく分析をしてしまうのか
1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーにそれっぽい⼿法を選ぶ理由 ▪▪▪□□□□□□□ 35/100%
何故なんとなく分析をしてしまうのか
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする ▪▪▪□□□□□□□ 37/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ ▪▪▪▪□□□□□□ 40/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ ▪▪▪▪□□□□□□ 42/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 類似⼿法と⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ ▪▪▪▪□□□□□□ 45/100%
テキトーにそれっぽい⼿法を選ぶの をどう防ぐか 何故その⼿法が必要なのかを考えた学習をする 何のために存在する⼿法︖ 類似⼿法との⽐較した、 メリット・デメリットは︖ 類似⼿法との違いは、 何故うまれたの︖ 要するに、論⽂のような読み⽅で理解・学習
Random Forestと Gradient Boosting Decision Treeの違いを ⾔えますか︖ Example ▪▪▪▪▪□□□□□ 50/100%
何故モデルをなんとなく作るか 1 モデルの構築⼿法を どうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに 何について考えればいいのかわかっていない どうやって防ぐか テキトーに選んだ⼿法で、 テキトーに要素を⽳埋めする理由
▪▪▪▪▪□□□□□ 57/100%
選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 60/100%
説明ができない部分は、 考えていない部分 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 62/100%
説明ができない部分は、 考えていない部分 この思考を繰り返すと、 考えて要素を⼊れられるようになる 選んだ要素ひとつひとつに問いを⽴て、 何故選んだのか説明可能な状態にする テキトーに要素を ⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 67/100%
次のモデルへの問いは何か Example ▪▪▪▪▪▪▪□□□ 70/100%
CM認知度 = α CM本数 + β CM種類ダミー + 定数 Example
▪▪▪▪▪▪▪□□□ 72/100%
Example OLSで解くので正規分布 CM認知度 = α CM本数 + β CM種類ダミー +
定数 ▪▪▪▪▪▪▪□□□ 74/100% どういう仮定を置いたモデル式なのか
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪□□□ 78/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 82/100% どういう仮定を置いたモデル式なのか 値が線形増加する OLSで解くので正規分布 CM種類が別でも 効果が同じ
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 83/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪▪□□ 87/100% 値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖
Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
値が線形増加する どういう仮定を置いたモデル式なのか 途中で飽和するから 対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも 効果が同じ CM種類で 効果が違うのでは︖ 何を問えばいいのかは慣れが必要。 はじめは上司に⼿伝ってもらおう。
今⽇のまとめ Today’s Summary ▪▪▪▪▪▪▪▪▪□ 94/100%
⾃分の頭でちゃんと考えた分析をするためには Today’s Summary 1 ⼿法の違いを意識して学習し、 2 何について考えればいいのか把握し思考することで、 3 ⾃分が考えたあらゆる選択に対して、説明可能にする。 ▪▪▪▪▪▪▪▪▪□
95/100%
▪▪▪▪▪▪▪▪▪▪ 100/100%