Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
Search
Higuchi kokoro
November 22, 2022
Business
1
2.5k
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
#kichijojipm
Higuchi kokoro
November 22, 2022
Tweet
Share
More Decks by Higuchi kokoro
See All by Higuchi kokoro
PMになって痛感した未知の未知とその対策
zerebom
1
360
Pythonによるネットワーク分析の基礎とコミュニティサクセスへの応用
zerebom
4
1.2k
Polarsの成長: v0.14からv1.0までの変遷と今後の展望
zerebom
1
920
ダッシュボードを使ってもらうには、 現場へのヒアリングが重要だと 改めて気づいた話
zerebom
4
2k
非同期処理でLLMにもっと働いてもらおう
zerebom
2
1.9k
使い回しやすい 2-stage recommender systemの デザインパターンを考えて実装した話
zerebom
3
1.9k
WantedlyでFeature Storeを導入する際に考えたこと
zerebom
4
5.6k
論文紹介: Cross-Market Product Recommendation
zerebom
1
210
Pythonでのパッケージング: エコシステムの理解と現場での活用 PyCon APAC2023
zerebom
2
2.4k
Other Decks in Business
See All in Business
タケウチグループRecruit
takeuchigroup
0
5.7k
株式会社EventHub 会社紹介資料
eventhub
1
35k
【キャリア採用】NEC会社紹介資料
nec_recruiting
0
200
株式会社CINC 会社案内/Company introduction
cinchr
6
56k
Local SEO for real people: 20 hard-hitting (and hilarious) audit lessons
ehababoud
0
270
株式会社ゼロフィールド 会社紹介
zerofield
0
130
メドピアグループ紹介資料
medpeer_recruit
10
130k
_iSM_採用ピッチ資料_改訂版_20250409.pdf
ism_terada
0
260
セーフィー株式会社(Safie Inc.) 会社紹介資料
safie_recruit
6
330k
ホワイトヘルスケア株式会社 会社説明資料 202504 / recruit
whitehealthcareinc
0
5.4k
モノリシックな「Chatwork」から、認証基盤をどのように切り出していったか
kubell_hr
1
250
(7枚)自信家の鼻をへし折る「ダニング・クルーガー効果曲線」とは?
nyattx
PRO
0
440
Featured
See All Featured
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.1k
GraphQLの誤解/rethinking-graphql
sonatard
71
10k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
Optimizing for Happiness
mojombo
377
70k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
We Have a Design System, Now What?
morganepeng
52
7.5k
The World Runs on Bad Software
bkeepers
PRO
67
11k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
It's Worth the Effort
3n
184
28k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
21k
Mobile First: as difficult as doing things right
swwweet
223
9.6k
Transcript
実務のデータ分析でハマった ことと対策 吉祥寺.pm31
自己紹介 📝 名前: - Higuchi Kokoro 📝 所属: - Wantedly
📊 職種 - Data Scientict @ 新卒2年目 🧑💻 お仕事 - Wantedly Visitの推薦の改善 👾 趣味 - 🎾 🏂 🍺 🧖♂️ ♨️ 🛫 アカウント: twitter: @zerebom_3 GitHub: @zerebom
本日のネタ (来年に向けて)データ分析タスクで、迷子にならないよう対策した話 背景 事業課題は役員→マネージャー→メンバーと経由して抽象度が下がって渡される 課題発見から始める、高い抽象度のタスクに挑戦も 迷子になることもしばしば
ハマったことと対策
ハマったこと: 集計したもののアクションに起こせない 例: 施策リリース以降、ユーザのプロフィール入力率低下 リリース前後の入力率をみるも、なだらかな変化で原因が判別できない 対策: 答えが出せる粒度まで集計を細かくする 入力率の低下傾向が見られるか? → 主観が入る
& 原因を特定できない リリースしたプラットフォームだけ低下したか? → Yes, Noを出せる
ハマったこと: 集計したものの人に説明できない GitHub issueで時系列に結果をまとめるも、集計により前提がひっくり返る 「この結果はもう古くて…」のように都度説明し、支離滅裂に 対策: どこを前提にしているか立ち戻れるようにする ツリー構造にしてどこまで調べたかわかるように 仮説と事実を分ける 各仮説の確信度をメモる
ハマったこと: 答えが出せないのに、時間をかけすぎた 新しい推薦モデルが、いくつか精度劣化する可能性があった ケースをログデータから再現しようとするも不正確・時間がかかる 対策: データ分析は数ある手法の一つであると認識する データと分析経験があるとついデータを触りがち Howの一つに過ぎない。ほかで仮説の確信度をあげられないか検討 ex) ヒアリング,
実際に製品を触る, A/Bテスト
まとめ 対策 解が出せるまで問題を細かくする どこまで前提か立ち戻れるようにする データ分析は手法の一つであると認識する 学び 伝わないなら価値は生めない 手段より目的