Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコ...
Search
tetsuroito
June 12, 2019
Education
3
3.3k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
2019/06/12 みんなのPython勉強会#46 の発表スライドです
tetsuroito
June 12, 2019
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
Data Engineering Study#30 LT資料
tetsuroito
2
1.5k
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.9k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
870
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
660
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
6k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
5k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
150
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.6k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
2k
Other Decks in Education
See All in Education
ロータリー国際大会について~国際大会に参加しよう~:古賀 真由美 会員(2720 Japan O.K. ロータリーEクラブ・(有)誠邦産業 取締役)
2720japanoke
1
690
社外コミュニティの歩き方
masakiokuda
2
220
AIを使って最新研究 について調べて発表しよ う!
mickey_kubo
4
150
Web Application Frameworks - Lecture 3 - Web Technologies (1019888BNR)
signer
PRO
0
3.1k
Портфолио - Шынар Ауелбекова
shynar
0
130
バケットポリシーの記述を誤りマネコンからS3バケットを操作できなくなりそうになった話
amarelo_n24
1
130
生態系ウォーズ - ルールブック
yui_itoshima
1
350
RSJ2025 ランチョンセミナー 一歩ずつ世界へ:学生・若手研究者のための等身大の国際化の始め方
t_inamura
0
330
DIP_3_Frequency
hachama
0
300
1008
cbtlibrary
0
100
IKIGAI World Fes:program
tsutsumi
1
2.5k
[Segah 2025] Gamified Interventions for Composting Behavior in the Workplace
ezefranca
0
220
Featured
See All Featured
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.1k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
Bash Introduction
62gerente
615
210k
Done Done
chrislema
186
16k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
10
670
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Visualization
eitanlees
150
16k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Navigating Team Friction
lara
190
15k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.5k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Transcript
データサイエンティスト養成読本 ビジネス活用編のこぼれ話と エンジニアとデータサイエンティストのコラボ について 2019/06/12 みんなのPython勉強会#46
誰? • 名前 : 伊藤 徹郎 (@tetsuroito) • 所属 :
Classi株式会社 データAI部 • 属性:データサイエンティスト • マイブーム:スパイスカレー • コミュニティ ◦ Data Analyst Meetup Tokyo ◦ Machine Learning Casual Talk ◦ Data Pipeline Casual Talk など
会社の宣伝
会社の宣伝
先週の話 ワタクシ
今日の話 • 去年出版した書籍(技術評論社) • DS養成読本シリーズ5作目 • 10人の著者によるオムニバス形式 • 主な内容 ◦
分析PJあるある ◦ ちょっとしたTips (Pythonどころかコードは1行も出てきません) 私が著者代表の一人です
何が書いてあるの?
何が書いてあるの? 分析プロジェクトの 機能要件ではなく、 非機能要件でつまづきや すいポイントのポエム
養成読本関連は色々記事あるので、そっち見て
閑話 休題
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 異文化理解力の重要性
最近のチームでも異なる文化の職種が多い マネジメント マーケティング エンジニアリング 製造・開発 サポート 販売 デザイン データサイエンス
データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac
データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac コードのリファクタリングまった なし!
• 環境が同期してなくて動かない • Pythonっぽくないコードの書き方 • 何を計算しているかよくわからない • それ必要?.pyの存在 • Pandasが使われていてメモリが...
• 運用って言葉知ってますか? • テストコード is どこ etc ... データサイエンス系のコードのリファクタがむずい *フィクションです
リファクタリングの理解が噛み合わない例 エンジニア データサイエンティスト 可読性・効率・高速化 などのためにリファクタ Jupyterの途中結果消して 綺麗にすればいいんでしょ?
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性
お互いに背景を理解する 努力をしましょう!
コミュニケーションをきちんととる • SlackなどでHRTにもとづき、普段から会話する • 心理的安全にもとづいた雑談ちょー大事 • 顔を合わせて会話する機会を作る • 炎上しない優しいPull Request
• コードを憎んで人を憎まず • 実装意図とか、その人の書き方の好みとかを知る
Google Colabでペアプロしてみる
機械学習や理論の勉強会をしてみる
達成したい目的 解決したい課題 同期 実装
• 近年の現場では多様な背景のメンバーが多い • データサイエンスPJの場合も例外じゃない • それぞれのコンテキストを読み取ろう • 粒度を変えてもそれは起きうる • 目的を念頭に適切なHowを選択しよう
まとめ
最後に PyCon US 共有会やるので、来てね!
ご静聴 ありがとう ございました