Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
Search
Higuchi kokoro
November 22, 2022
Business
1
2.4k
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
#kichijojipm
Higuchi kokoro
November 22, 2022
Tweet
Share
More Decks by Higuchi kokoro
See All by Higuchi kokoro
Pythonによるネットワーク分析の基礎とコミュニティサクセスへの応用
zerebom
4
880
Polarsの成長: v0.14からv1.0までの変遷と今後の展望
zerebom
1
650
ダッシュボードを使ってもらうには、 現場へのヒアリングが重要だと 改めて気づいた話
zerebom
4
1.7k
非同期処理でLLMにもっと働いてもらおう
zerebom
2
1.5k
使い回しやすい 2-stage recommender systemの デザインパターンを考えて実装した話
zerebom
3
1.5k
WantedlyでFeature Storeを導入する際に考えたこと
zerebom
4
5.4k
論文紹介: Cross-Market Product Recommendation
zerebom
1
170
Pythonでのパッケージング: エコシステムの理解と現場での活用 PyCon APAC2023
zerebom
2
2.1k
LLMを活用した推薦システムの改善: 課題と初期導入のアプローチ
zerebom
4
4.2k
Other Decks in Business
See All in Business
VISASQ: ABOUT US
eikohashiba
15
470k
Canary Inc. Company Deck
canaryinc
0
41k
決算審査意見書自動作成ツール 改良プロジェクト
tokyo_metropolitan_gov_digital_hr
0
300
重厚長大なものづくり企業におけるプロダクトマネジメントの挑戦と苦悩 / pmconf2024
tkchy
0
5k
re:Infrastructure_for the NextGen AI/ML and Beyond
ichichi
0
160
デジタルで創れ!未来の東京消防庁
tokyo_metropolitan_gov_digital_hr
1
320
概要
_connect
0
710
ふわっとした考えを仮説にするまでのステップ
tumada
PRO
8
1.2k
【After】サービス紹介資料③_HP掲載用
redeslide
0
510
会社紹介資料 / ProfileBook
gpol
4
25k
Sales Marker Culture book
salesmarker
PRO
6
25k
職員給与等実態調査のDX
tokyo_metropolitan_gov_digital_hr
0
320
Featured
See All Featured
Building Flexible Design Systems
yeseniaperezcruz
327
38k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.9k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
520
Building Your Own Lightsaber
phodgson
103
6.1k
jQuery: Nuts, Bolts and Bling
dougneiner
61
7.5k
Documentation Writing (for coders)
carmenintech
66
4.5k
For a Future-Friendly Web
brad_frost
175
9.4k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
32
2.7k
A designer walks into a library…
pauljervisheath
204
24k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
48
2.2k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
169
50k
Docker and Python
trallard
42
3.1k
Transcript
実務のデータ分析でハマった ことと対策 吉祥寺.pm31
自己紹介 📝 名前: - Higuchi Kokoro 📝 所属: - Wantedly
📊 職種 - Data Scientict @ 新卒2年目 🧑💻 お仕事 - Wantedly Visitの推薦の改善 👾 趣味 - 🎾 🏂 🍺 🧖♂️ ♨️ 🛫 アカウント: twitter: @zerebom_3 GitHub: @zerebom
本日のネタ (来年に向けて)データ分析タスクで、迷子にならないよう対策した話 背景 事業課題は役員→マネージャー→メンバーと経由して抽象度が下がって渡される 課題発見から始める、高い抽象度のタスクに挑戦も 迷子になることもしばしば
ハマったことと対策
ハマったこと: 集計したもののアクションに起こせない 例: 施策リリース以降、ユーザのプロフィール入力率低下 リリース前後の入力率をみるも、なだらかな変化で原因が判別できない 対策: 答えが出せる粒度まで集計を細かくする 入力率の低下傾向が見られるか? → 主観が入る
& 原因を特定できない リリースしたプラットフォームだけ低下したか? → Yes, Noを出せる
ハマったこと: 集計したものの人に説明できない GitHub issueで時系列に結果をまとめるも、集計により前提がひっくり返る 「この結果はもう古くて…」のように都度説明し、支離滅裂に 対策: どこを前提にしているか立ち戻れるようにする ツリー構造にしてどこまで調べたかわかるように 仮説と事実を分ける 各仮説の確信度をメモる
ハマったこと: 答えが出せないのに、時間をかけすぎた 新しい推薦モデルが、いくつか精度劣化する可能性があった ケースをログデータから再現しようとするも不正確・時間がかかる 対策: データ分析は数ある手法の一つであると認識する データと分析経験があるとついデータを触りがち Howの一つに過ぎない。ほかで仮説の確信度をあげられないか検討 ex) ヒアリング,
実際に製品を触る, A/Bテスト
まとめ 対策 解が出せるまで問題を細かくする どこまで前提か立ち戻れるようにする データ分析は手法の一つであると認識する 学び 伝わないなら価値は生めない 手段より目的