Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
Search
Higuchi kokoro
November 22, 2022
Business
1
2.4k
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
#kichijojipm
Higuchi kokoro
November 22, 2022
Tweet
Share
More Decks by Higuchi kokoro
See All by Higuchi kokoro
Pythonによるネットワーク分析の基礎とコミュニティサクセスへの応用
zerebom
4
780
Polarsの成長: v0.14からv1.0までの変遷と今後の展望
zerebom
1
620
ダッシュボードを使ってもらうには、 現場へのヒアリングが重要だと 改めて気づいた話
zerebom
4
1.6k
非同期処理でLLMにもっと働いてもらおう
zerebom
2
1.4k
使い回しやすい 2-stage recommender systemの デザインパターンを考えて実装した話
zerebom
3
1.5k
WantedlyでFeature Storeを導入する際に考えたこと
zerebom
4
5.3k
論文紹介: Cross-Market Product Recommendation
zerebom
1
160
Pythonでのパッケージング: エコシステムの理解と現場での活用 PyCon APAC2023
zerebom
2
2k
LLMを活用した推薦システムの改善: 課題と初期導入のアプローチ
zerebom
4
4.1k
Other Decks in Business
See All in Business
Startup CTO of the year 2024 株式会社ハイヤールー
kkosukeee
0
3.8k
株式会社AGEST紹介資料/AGEST Recruitment
agest_recruit
0
2.2k
culturebook_WeddingParkShip
weddingpark
0
570
“難しい”をもっと楽に簡単に♪ 届出ダンジョンからの脱出
tokyo_metropolitan_gov_digital_hr
0
310
これを使用
ehealthcare2004
0
350
Recruiting Deck_株式会社HACHI
hachi_hiring
1
540
VISASQ: ABOUT US
eikohashiba
15
460k
ビジネスの変化に迅速に反応 質・量どちらも追及する 星野リゾートのノーコード戦略
junkokotake
0
270
株式会社Beer and Tech/HitoHana(ひとはな) 採用資料 2024.11
beerandtech_recruiter
1
570
もしドラッカーがアジャイルコーチになったら / If Drucker Were an Agile Coach
fkino
2
410
AIを活用した住家被害認定支援ツールの開発
tokyo_metropolitan_gov_digital_hr
0
390
会社紹介資料
ldf_tech
1
330
Featured
See All Featured
RailsConf 2023
tenderlove
29
900
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
We Have a Design System, Now What?
morganepeng
50
7.2k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
159
15k
Measuring & Analyzing Core Web Vitals
bluesmoon
4
130
Git: the NoSQL Database
bkeepers
PRO
427
64k
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
Fashionably flexible responsive web design (full day workshop)
malarkey
405
65k
Done Done
chrislema
181
16k
Designing for Performance
lara
604
68k
Code Review Best Practice
trishagee
64
17k
Gamification - CAS2011
davidbonilla
80
5k
Transcript
実務のデータ分析でハマった ことと対策 吉祥寺.pm31
自己紹介 📝 名前: - Higuchi Kokoro 📝 所属: - Wantedly
📊 職種 - Data Scientict @ 新卒2年目 🧑💻 お仕事 - Wantedly Visitの推薦の改善 👾 趣味 - 🎾 🏂 🍺 🧖♂️ ♨️ 🛫 アカウント: twitter: @zerebom_3 GitHub: @zerebom
本日のネタ (来年に向けて)データ分析タスクで、迷子にならないよう対策した話 背景 事業課題は役員→マネージャー→メンバーと経由して抽象度が下がって渡される 課題発見から始める、高い抽象度のタスクに挑戦も 迷子になることもしばしば
ハマったことと対策
ハマったこと: 集計したもののアクションに起こせない 例: 施策リリース以降、ユーザのプロフィール入力率低下 リリース前後の入力率をみるも、なだらかな変化で原因が判別できない 対策: 答えが出せる粒度まで集計を細かくする 入力率の低下傾向が見られるか? → 主観が入る
& 原因を特定できない リリースしたプラットフォームだけ低下したか? → Yes, Noを出せる
ハマったこと: 集計したものの人に説明できない GitHub issueで時系列に結果をまとめるも、集計により前提がひっくり返る 「この結果はもう古くて…」のように都度説明し、支離滅裂に 対策: どこを前提にしているか立ち戻れるようにする ツリー構造にしてどこまで調べたかわかるように 仮説と事実を分ける 各仮説の確信度をメモる
ハマったこと: 答えが出せないのに、時間をかけすぎた 新しい推薦モデルが、いくつか精度劣化する可能性があった ケースをログデータから再現しようとするも不正確・時間がかかる 対策: データ分析は数ある手法の一つであると認識する データと分析経験があるとついデータを触りがち Howの一つに過ぎない。ほかで仮説の確信度をあげられないか検討 ex) ヒアリング,
実際に製品を触る, A/Bテスト
まとめ 対策 解が出せるまで問題を細かくする どこまで前提か立ち戻れるようにする データ分析は手法の一つであると認識する 学び 伝わないなら価値は生めない 手段より目的