$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
いま、データに必要な解像度
Search
Hikaru Kashida
December 09, 2024
Business
22
8.5k
いま、データに必要な解像度
Hikaru Kashida
December 09, 2024
Tweet
Share
More Decks by Hikaru Kashida
See All by Hikaru Kashida
Growth Grand Theory - Dos and Donts
hik0107
16
6.9k
Data, Design and Government
hik0107
48
35k
戦略と実行をつなぐデータ
hik0107
46
23k
FREE AGENDA #65 施策を通じて得た抽象的な学び
hik0107
14
4.5k
noteの躍進を支えた”定性と定量の甘い関係”
hik0107
14
36k
なんでデータアナリストやってるの
hik0107
16
6.6k
Simple Data Analytics Leads impact
hik0107
127
160k
Introduction of Mercari BI team and Case Studies of Analytics for Service in US
hik0107
9
67k
Mercari BI team - Data Analytics Summit 2018
hik0107
17
16k
Other Decks in Business
See All in Business
CompanyDeck_v6.pdf
xid
2
17k
経営に囚われ_現場が見えなくなってしまったPMの奮闘記.pdf
akihiro0038
2
5.1k
DNX Ventures Japan|Introduction Deck
natsumidnx
0
580
immedio_Culture_Deck_202411
yusukehagiwara
0
800
ドローンを活用した汚泥焼却炉内点検のDX
tokyo_metropolitan_gov_digital_hr
0
230
決算審査意見書自動作成ツール 改良プロジェクト
tokyo_metropolitan_gov_digital_hr
0
180
株式会社Melon_会社説明資料
melon
0
280
会社案内資料
mkengineering
1
210
c-slide_キックオフミーティング資料
coneinc
0
460
松岡会計事務所・会社案内
wf714201
0
270
KAKEHASHI Company Deck / Company Deck
kakehashi
4
360
NAVICUS会社紹介資料_PC版/明日が楽しみになる居場所をつくる
navicus
PRO
0
230
Featured
See All Featured
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Rails Girls Zürich Keynote
gr2m
94
13k
A Tale of Four Properties
chriscoyier
157
23k
4 Signs Your Business is Dying
shpigford
181
21k
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
29
2k
GitHub's CSS Performance
jonrohan
1030
460k
Making the Leap to Tech Lead
cromwellryan
133
9k
Thoughts on Productivity
jonyablonski
67
4.3k
The Cost Of JavaScript in 2023
addyosmani
45
6.9k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
How to Ace a Technical Interview
jacobian
276
23k
Transcript
2024.12.10 Zero to One Conference いま、データに必要な解像度 Hikaru Kashida - Chief
Analytics Officer, デジタル庁
Current 日本政府 デジタル庁(2022-) - CxO(Chief Analytics Officer) Past 株式会社メルカリ(2016-2020) -
Head of Data Analyst 株式会社ブレインパッド(2014-2016) - Data Scientist etc. Speaker - Hikaru Kashida
Policy Data Dashboard Project(政策データダッシュボード) https://www.digital.go.jp/resources/govdashboard
いま、データに必要な解像度
「解像度」とは: 観測対象がどこまで詳しく描写されているか、異なる対象がどこまで分離されているかを意味する (wikipediaより 一部意訳的に引用) データ分析は事業の「解像度」を上げるための営み モノリシックなものを分離し、事業をより良く理解し、アクションの精度を上げる 例:KPIツリーによる事業目標の分解、セグメンテーションによる顧客の分解(最終形がone to one)
だが、そもそも我々は「データ」というものに対して解像度が低くないか データという言葉の名の下、いろいろなものが十把一絡げに語られている(=異なるものが分離されていない) このセッションを通して、いくつかの質問とそれに対する世間的な通説の否定を通して、 「データ」について、 解像度を高めるための議論をしてみたいと思う。
1 データを使うとはどういうことか 2 データ分析は何に使えるか 3 データに求められる態度とは 4 データの価値は何で決まるか Conclusion Theme
- いま、データに必要な解像度
データを使うとはどういうことか? Theme1
よく耳にする定説 データをビジネスに役立てること Theme1
いま必要な解像度 情報量をデータ消費者の言語体系に調整すること Theme1
データを使うとは 情報量をデータ消費者に最適化して調整すること 定説の否定:データ消費者の種別と特徴について解像度が低い データの消費者によって最適な情報量は全く異なる
事業マネジメント (言語:事業目標、事業計画) 企画 (言語:KPI、施策、顧客体験) アナリティクス (言語:分析モデル、インサイト) 機械言語 (言語:Python、SQL) 計算インフラ 最終的なアクションポイント
(顧客やオペレーション) 人間判断介在モデル → Human Friendlyな情報量であることが最重要 自動化モデル → データ量と特徴量Engeeringが最重要 要件解釈 データ準備・ プログラミング 判断の上でのアクション 言語の異なる5つのバリューチェーンと情報量の調整プロセス 1 2 3
いま必要な解像度 情報量をデータ消費者に最適化して調整すること データ消費者が人間の場合、あくまで情報の摂取の容易さと判断のしやすさ が最も優先される。関係者が多いほど、より平易さが求められる 直感的な指標設計、統計量 適度な分解の粒度(~20カテゴリなどを超えると無理) わかりやすい可視化 データ量の大きさ、モデルの精緻さetc. は重要性としてはセカンダリ 最終消費者が機械の場合、評価関数の巧拙・データ量・特徴量の設計が重要
それぞれで必要なアジェンダが全く異なる
データ分析は何に使えるか? Theme2
よく耳にする定説 データは意思決定のためにある Theme2
いま必要な解像度 データは意思決定と実行の間にある Theme2
データ分析は何に使えるか データは意思決定と実行の間にある 定説の否定: データと意思決定と事業の関係について解像度が低い 大きな意思決定(戦略) 、小さな意思決定(オペレーション)がある 日本型組織の意思決定は「瞬間的」ではなく「逐次浸透的」 意思決定と実行の熱伝導は常に100%ではない. 両者は地続きの関係にある。事業の本質は「実行」 データ
× 大きな意思決定 のみにこだわると 実は市場が小さい 戦略と実行の間にあると考えるのが適切で最もバリューを発揮すると考える 意思決定と云う言葉のダイナミックさはまやかしを含んでいる。むしろ、空気のように目立たずに戦略 と行動に介入している方がはるかに上策
ideal realistic
出典:Hunter × Hunter
“俺は一人じゃねえ 人間を舐めるなよ メルエム“ ー ネテロ(ハンター協会会長) 人間の強さ・賢さ 直感・知識に寄る相応な戦略の策定 集合知/暗黙知の集積を用いて、それらしい戦略を組み立てることが出来る 複合的な、複雑な要素を加味して、最適解を導き出せる 人間と組織の愚かしさ
戦略と実行のベクトルの内積が常に「1」にならない 組織の構成員にはばらつきがある。全員に正しく戦略を熱伝導させるのは至難 人は怠ける 自分の好奇心で動く 戦略の理解が正しくない etc. 人間を舐めるな 俺は一人じゃねえ 人間(の集団の愚かさ)を舐めるな
戦略 実行 データ(数値)を元に 戦略が実行に一致することを図る データ(数値)を元に 実行が戦略に一致していることを測る データ (数値) データは意思決定と実行の間にある
データに求められる態度とは? Theme3
よく耳にする定説 データは常に客観的であるべき Theme3
いま必要な解像度 データは主観×客観 の重ね合わせ Theme3
データに求められる態度とは データは主観×客観 の重ね合わせ 定説の否定:データの役割、客観性の意味について解像度が低い 分析: 「ある事物を分解し、それらを成立させている成分・要素・側面を明らかにする」 分解に真の客観性はない。我々は常に何かしら現実の環境要因によって世界を恣意的に見ている 例:自然言語における種族の分解
セグメントに正解はない。そこにあるのは「世界をどう見たいか」という “意思の反映” 言語学等、世界の認識に関する学問でも提唱されていることと同じ 日本語:鳩 英語:白い鳩はDove 黒い鳩はPigeon 仏語:Papillon(パピヨン) 日本語:蛾と蝶 日本語:ウマ モンゴル:オス
or メス・去勢の有無・馬齢 が違うとそれぞれに専用の単語がある 英語:Rain 日本語:五月雨、時雨、霧雨、夕立、小雨、天気雨、俄雨 ...400種類! → どこの国でも世界の存在は変わらないが、世界を切り取るセグメントのあり方は様々。 どれが正しいというものはない。あるのは「世界をどう分解すれば最も良く生きれるか」という視点の結果のみ
3ヶ月前 3ヶ月前 - - - • • ✕ ✕ ✕
✕ • • 前々月 前々月 - - ✕ ✕ - 前月 前月 - - • • 初 今月 今月 初 初 新規 1000 1000 新規 既存 5,000 500 既存 ルーキー 復帰 2000 4500 2000 復帰 • • • • • ユーザセグメントは事業で何を重んじるかを表現している必要がある。 ある程度既存ユーザが積み上がっている事業 シンプルさを重視して3セグメントに絞り込んで考える 新規ユーザの次月残存を重視するセグメント組みにする 新規ユーザの残存に課題がある事業 500 1000
いま必要な解像度 データは主観×客観 の重ね合わせ 客観性は美しさであり、弱さ 過度に客観的であろうとするスタンスは、怠慢であり、逃避であり、弱さである 事業とは「行動」の蓄積。 客観性と行動の間には距離がある。空→雨→傘 の間を誰が埋めるか? 客観的な事実を提供するだけで仕事が成立するのは、長いバリューチェーンを許容される環境だけ 自分がいるのがそういった環境であるのか、の峻別の上で判断されるべき
データの価値は何で決まるか Theme4
よく耳にする定説 データの価値はデータの量、データ基盤、 分析のクオリティで決まる Theme4
いま必要な解像度 データの価値はユースケースで決まる Theme4
データの価値は何で決まるか データの価値はユースケースで決まる 定説の否定:データの価値が出せる条件について解像度が低い データ分析によるアウトプットが機能する範囲はそれほど実は広くない。 間違った分野にどれだけリッチなデータを投入しても、 Rich-In / Garbage-Out になる スタートアップと同じ。間違った市場に参入した時点で、99%負ける
データを適用するシーンが適切であればSmall Dataでも勝機は十分ある 「狭い必要十分条件」を理解する必要がある データは大概のシーンでMust-Haveな要素ではない データを使わずとも事業は最低限は成り立つ。この事実を真摯に受け止める必要がある 「スポーツ科学を知らずとも、Apple Healthcareを使わずともダイエットは出来る」
データ(分析)が機能するシーンの類型を理解する 経験上、パターンはそれほど多くない 80%は「対他者で必要だから」 20%は「自身が知りたいから」 善意のデータ活用は尊いが、20%程度。 監督者と実施者との間のフリクションが発生するところに陣取るほうがマーケットとしては強い 監督者と実施者との間のフリクション モデル(全体の80%) ガバナンス・監理(事業計画など) 大きい判断の正当化、説明責任(マーケティング投資など)
戦略 <-> 実行 の橋渡し、実行者への説明 と 実行からのフィードバック 善意のデータ活用 モデル(全体の20%) パフォーマンス連動で給与が決まるなど、どんな手を使っても成果を上げたい 自身のサービスのフィードバックと改善に純粋に飢えている ハマるユースケースを自分でイチから見つけ出すのは実は簡単ではない。事業の特性とガバナンス構造、 キーパーソンの性格の理解など、割と全人格的な能力が求められる。
サピエンスが優れているのは、集団で虚構(共同幻想)を共有するこ とで大人数でも一体となって行動できるから。 (サピエンス全史, ユヴァル・ノア・ハラリ) 企業組織はその代表例。 会社のような大人数の集団が一致団結してコトに当たるのは実はそんなに簡単ではない 他者間で常に意見の不一致と疑いが発生する 集団の中で信じられる共通認識を作る、はデータの一つの大きな市場 この世で最もコストが高く付くことのひとつは「疑うこと」 データによって疑うコスト、意見の不一致や、不毛な主観同士の衝突を調停するだけで、組織のスルー
プットは大きく上がる
余談 データと世界3大発明 羅針盤 → 意思決定材料 主な功績:大航海時代において、航海の成功率(生還率)を高め、世界の開拓に寄与 例えると:正しい意思決定のための材料 活版印刷 主な功績:教会にしかなかった聖書を一般家庭でも保有可能にするなど、情報の非対称性の打破 例えると:正しい情報や方針の普及啓蒙、社会上層部のサイロ化の喝破
火薬 → AI 等 主な功績:火薬を用いた武器により、それまでの「兵力(頭数) 」∝ 勝率 の構造に技術力が介入 例えると:データを用いたビジネス、非労働集約依存型のビジネスモデルの創出
Conclusion 1 データを使うとはどういうことか 情報量をデータ消費者の言語体系に調整すること (定説:データをビジネスに役立てること ) 2 データ分析は何に使えるか データは意思決定と実行の間にある (定説:データは意思決定のためにある
) 3 データに必要な態度とは データは主観×客観 の重ね合わせ (定説:データは常に客観的であるべき ) 4 データの価値は何で決まるか データの価値はユースケースで決まる (定説:データの価値はデータの量、データ基盤、分析のクオリティで決まる ) Conclusion
結論 正直、データについての一般的な言説は、不正確で無責任な幻想が多い。 それらは主に「事業とデータの交点」に関する解像度の低さから来ている。 机上の空想から生み出された、現実には役立たないセオリーに惑わされないこと。 常に「十分な解像度で理解しているか」を意識すること。データも事業も。 Conclusion