Data Gateway Talk vol.4 分析案件をやり始めたときに陥っていたことの共有と対策 / DataGatewayTalk-Vol4-nagano

分析案件をやり始めたときに陥っていたことの共有と対策⻑野克也 (@chitose_ng)

後⽇、スライドのアップロードをします。 Caution □□□□□□□□□□ 0/100%

DataGatewayをくぐり始めた⼈ DataGatewayをくぐろうとする部下がいる⼈ Target □□□□□□□□□□ 1/100%

Company TVISION INSIGHTS株式会社 Work - テレビの視聴態度のR&D - クライアントKPIとの関係性調査 ʘςϨϏͷࢹௌଶ౓ΛଌΔձࣾʗ Other
チトセナガノ(@chitose_ng) まずは蝋の翼から Tableauデータ分析 ~実践から活⽤まで~ プロフィール □□□□□□□□□□ 2/100%

Company TVISION INSIGHTS株式会社業界的に新領域のデータを提供する会社 ʘςϨϏͷࢹௌଶ౓ΛଌΔձࣾʗ プロフィール NO PRESENTATION ?/100%

モニターのリビングに⼈体認識技術を組み込んだ機械を設置し、視聴態度データを取得 NO PRESENTATION ?/100%

⾃動で顔認識・識別どう観ているのか（視聴体制）誰が観ているのか（個⼈特定）テレビの注視度を計測する NO PRESENTATION ?/100%

業界的に、今までは「テレビがついているか」のデータから KPIへの影響を⾒ていた NO PRESENTATION ?/100%

「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる NO PRESENTATION ?/100%

「テレビをどう観ているか」という解像度がより上がったデータから KPIへの影響を⾒ることができる業界的に未解明の部分が多いので、どう使えるかのR&DとクライアントのKPIとの関係を調査/分析仕事内容 NO PRESENTATION ?/100%

2015 04 2017 09 2019 01 Today SQLおじさん (データ抽出の⼈/ データアーキテクト)
R&D クライアント分析 2年半 1年半 BI屋 10ヶ⽉ ʘίίͷؾ෇͖ʗ 経歴 □□□□□□□□□□ 6/100%

分析案件をやり始めたときによくあった会話

こんな感じのモデル考えてます！ ◦◦という手法もあると思うけどなんでこの手法なの？な、なんとなくっす。。。本当にあったアレな会話1 ʘ ্ ࢘ Ͱ ͢
ʗ ▪□□□□□□□□□ 10/100%

こんな感じのモデル考えてます！このモデル式だと☓☓に△△って仮定を置いてるってことだよね？あっ、はい多分そうっす。（言われるまで意識してなかったけど) 本当にあったアレな会話2 ʘ ্ ࢘ Ͱ
͢ ʗ ▪□□□□□□□□□ 12/100%

何故なんとなく分析をしてしまうのか︖ Topic

何故なんとなく分析をしてしまうのか 1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない ▪□□□□□□□□□ 16/100%

1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていない ▪▪□□□□□□□□ 20/100% 何故なんとなく分析をしてしまうのか

1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていないテキトーにそれっぽい⼿法を選ぶ理由テキトーに選んだ⼿法で、テキトーに要素を⽳埋めする理由 ▪▪□□□□□□□□
26/100% 何故なんとなく分析をしてしまうのか

1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていないどうやって防ぐかテキトーにそれっぽい⼿法を選ぶ理由 ▪▪▪□□□□□□□ 35/100%
何故なんとなく分析をしてしまうのか

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする ▪▪▪□□□□□□□ 37/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする何のために存在する⼿法︖ ▪▪▪▪□□□□□□ 40/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする類似⼿法と⽐較した、メリット・デメリットは︖ ▪▪▪▪□□□□□□ 42/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする類似⼿法と⽐較した、メリット・デメリットは︖ 類似⼿法との違いは、何故うまれたの︖ ▪▪▪▪□□□□□□ 45/100%

テキトーにそれっぽい⼿法を選ぶのをどう防ぐか何故その⼿法が必要なのかを考えた学習をする何のために存在する⼿法︖ 類似⼿法との⽐較した、メリット・デメリットは︖ 類似⼿法との違いは、何故うまれたの︖ 要するに、論⽂のような読み⽅で理解・学習

Random Forestと Gradient Boosting Decision Treeの違いを⾔えますか︖ Example ▪▪▪▪▪□□□□□ 50/100%

何故モデルをなんとなく作るか 1 モデルの構築⼿法をどうやって選んだらいいのかわかっていない 2 モデルの構築⼿法を選んだあとに何について考えればいいのかわかっていないどうやって防ぐかテキトーに選んだ⼿法で、テキトーに要素を⽳埋めする理由
▪▪▪▪▪□□□□□ 57/100%

選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 60/100%

説明ができない部分は、考えていない部分選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 62/100%

説明ができない部分は、考えていない部分この思考を繰り返すと、考えて要素を⼊れられるようになる選んだ要素ひとつひとつに問いを⽴て、何故選んだのか説明可能な状態にするテキトーに要素を⽳埋めするのをどう防ぐか ▪▪▪▪▪▪□□□□ 67/100%

次のモデルへの問いは何か Example ▪▪▪▪▪▪▪□□□ 70/100%

CM認知度 = α CM本数 + β CM種類ダミー + 定数 Example
▪▪▪▪▪▪▪□□□ 72/100%

Example OLSで解くので正規分布 CM認知度 = α CM本数 + β CM種類ダミー +
定数 ▪▪▪▪▪▪▪□□□ 74/100% どういう仮定を置いたモデル式なのか

Example CM認知度 = α CM本数 + β CM種類ダミー + 定数
▪▪▪▪▪▪▪□□□ 78/100% どういう仮定を置いたモデル式なのか値が線形増加する OLSで解くので正規分布

▪▪▪▪▪▪▪▪□□ 82/100% どういう仮定を置いたモデル式なのか値が線形増加する OLSで解くので正規分布 CM種類が別でも効果が同じ

▪▪▪▪▪▪▪▪□□ 83/100% 値が線形増加するどういう仮定を置いたモデル式なのか途中で飽和するから対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも効果が同じ

▪▪▪▪▪▪▪▪□□ 87/100% 値が線形増加するどういう仮定を置いたモデル式なのか途中で飽和するから対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも効果が同じ CM種類で効果が違うのでは︖

値が線形増加するどういう仮定を置いたモデル式なのか途中で飽和するから対数化が必要では︖ OLSで解くので正規分布 CM種類が別でも効果が同じ CM種類で効果が違うのでは︖ 何を問えばいいのかは慣れが必要。はじめは上司に⼿伝ってもらおう。

今⽇のまとめ Today’s Summary ▪▪▪▪▪▪▪▪▪□ 94/100%

⾃分の頭でちゃんと考えた分析をするためには Today’s Summary 1 ⼿法の違いを意識して学習し、 2 何について考えればいいのか把握し思考することで、 3 ⾃分が考えたあらゆる選択に対して、説明可能にする。 ▪▪▪▪▪▪▪▪▪□
95/100%

▪▪▪▪▪▪▪▪▪▪ 100/100%

Data Gateway Talk vol.4 分析案件をやり始めたときに 陥っていたことの共...

Data Gateway Talk vol.4 分析案件をやり始めたときに 陥っていたことの共有と対策 / DataGatewayTalk-Vol4-nagano

More Decks by knagano

Other Decks in Business

Featured

Transcript

Data Gateway Talk vol.4 分析案件をやり始めたときに陥っていたことの共...

Data Gateway Talk vol.4 分析案件をやり始めたときに陥っていたことの共有と対策 / DataGatewayTalk-Vol4-nagano