Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
Search
Higuchi kokoro
November 22, 2022
Business
1
2.3k
実務のデータ分析でハマったことと対策 / Kichijoji.pm 31
#kichijojipm
Higuchi kokoro
November 22, 2022
Tweet
Share
More Decks by Higuchi kokoro
See All by Higuchi kokoro
Polarsの成長: v0.14からv1.0までの変遷と今後の展望
zerebom
1
500
ダッシュボードを使ってもらうには、 現場へのヒアリングが重要だと 改めて気づいた話
zerebom
4
1.5k
非同期処理でLLMにもっと働いてもらおう
zerebom
2
1.3k
使い回しやすい 2-stage recommender systemの デザインパターンを考えて実装した話
zerebom
3
1.3k
WantedlyでFeature Storeを導入する際に考えたこと
zerebom
4
5.1k
論文紹介: Cross-Market Product Recommendation
zerebom
1
140
Pythonでのパッケージング: エコシステムの理解と現場での活用 PyCon APAC2023
zerebom
2
1.8k
LLMを活用した推薦システムの改善: 課題と初期導入のアプローチ
zerebom
4
4k
ChatGPTとの会話のデータ分析: 開発対話を最適化するための指針と特性
zerebom
1
2.2k
Other Decks in Business
See All in Business
Mercari-Fact-book_en
mercari_inc
1
20k
エンジニア組織30人の壁を超えるための 評価システムとマネジメントのスケール / Scaling evaluation system and management
yoshikiiida
10
3k
イークラウド会社紹介 ~ひとりひとりの想いをつなぎ、挑戦に力を~
ecrowd
1
1.9k
記憶力に頼らないタスク管理 / Task management without relying on memory
tbpgr
7
14k
BASE株式会社 BASE Dept Product Dev Division 紹介資料
base
PRO
1
1.6k
事業家になる道のり比較.pdf
canvas_recruit
1
290
Spacemarket Culture Deck
spacemarket
1
56k
依頼仕事の最適化 〜未完了をいかに完了にするか〜
katsuhisa91
PRO
16
8.3k
新卒エンジニア向け会社紹介資料/newgraduates-engineer
nextbeat
2
1.5k
イオングローバルSCM_会社概要
agscm
0
1.8k
ユニファ株式会社 会社紹介資料
unifacorp
0
730
エイチーム M&A方針説明会資料(2024年8月7日)
ateam
0
380
Featured
See All Featured
Typedesign – Prime Four
hannesfritz
38
2.3k
What's new in Ruby 2.0
geeforr
340
31k
Build your cross-platform service in a week with App Engine
jlugia
228
18k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
38
9.1k
Building Your Own Lightsaber
phodgson
101
5.9k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
45
4.8k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
230
17k
GitHub's CSS Performance
jonrohan
1029
450k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
103
47k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
27
7.4k
Mobile First: as difficult as doing things right
swwweet
220
8.8k
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
Transcript
実務のデータ分析でハマった ことと対策 吉祥寺.pm31
自己紹介 📝 名前: - Higuchi Kokoro 📝 所属: - Wantedly
📊 職種 - Data Scientict @ 新卒2年目 🧑💻 お仕事 - Wantedly Visitの推薦の改善 👾 趣味 - 🎾 🏂 🍺 🧖♂️ ♨️ 🛫 アカウント: twitter: @zerebom_3 GitHub: @zerebom
本日のネタ (来年に向けて)データ分析タスクで、迷子にならないよう対策した話 背景 事業課題は役員→マネージャー→メンバーと経由して抽象度が下がって渡される 課題発見から始める、高い抽象度のタスクに挑戦も 迷子になることもしばしば
ハマったことと対策
ハマったこと: 集計したもののアクションに起こせない 例: 施策リリース以降、ユーザのプロフィール入力率低下 リリース前後の入力率をみるも、なだらかな変化で原因が判別できない 対策: 答えが出せる粒度まで集計を細かくする 入力率の低下傾向が見られるか? → 主観が入る
& 原因を特定できない リリースしたプラットフォームだけ低下したか? → Yes, Noを出せる
ハマったこと: 集計したものの人に説明できない GitHub issueで時系列に結果をまとめるも、集計により前提がひっくり返る 「この結果はもう古くて…」のように都度説明し、支離滅裂に 対策: どこを前提にしているか立ち戻れるようにする ツリー構造にしてどこまで調べたかわかるように 仮説と事実を分ける 各仮説の確信度をメモる
ハマったこと: 答えが出せないのに、時間をかけすぎた 新しい推薦モデルが、いくつか精度劣化する可能性があった ケースをログデータから再現しようとするも不正確・時間がかかる 対策: データ分析は数ある手法の一つであると認識する データと分析経験があるとついデータを触りがち Howの一つに過ぎない。ほかで仮説の確信度をあげられないか検討 ex) ヒアリング,
実際に製品を触る, A/Bテスト
まとめ 対策 解が出せるまで問題を細かくする どこまで前提か立ち戻れるようにする データ分析は手法の一つであると認識する 学び 伝わないなら価値は生めない 手段より目的