Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコ...
Search
tetsuroito
June 12, 2019
Education
3
3.2k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
2019/06/12 みんなのPython勉強会#46 の発表スライドです
tetsuroito
June 12, 2019
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.6k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
730
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
0
540
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
5.4k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.4k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
100
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.3k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.8k
サブスクリプションミートアップOPトークスライド
tetsuroito
0
4.6k
Other Decks in Education
See All in Education
学習指導要領から職場の学びを考えてみる / Thinking about workplace learning from learning guidelines
aki_moon
1
540
〜AWS初心者向け〜 ベストプラクティスから学ぶ 「AWSセキュリティの高め方」
koheiyoshikawa
1
770
エンジニアの イネーブルメントを支える 技術発信文化の作り方
sedo
0
150
自己紹介 / who-am-i
yasulab
2
3.9k
AWS認定試験 DEA受験記
nnydtmg
1
390
Gemini in Android Studio 使ってますか?
satoryo56
0
290
Unlocking the Top Marketing Secrets for L&D
tmiket
1
330
Matz に頼られたので張り切って2時間ほどドイツと日本の互いの Ruby 学習事情についてディスカッションした話
yasulab
1
360
【基本】Oracle Database データベース・ユーザー・セキュリティ入門
oracle4engineer
PRO
1
690
Dashboards - Lecture 11 - Information Visualisation (4019538FNR)
signer
PRO
1
1.6k
LINE ミニアプリ開発のメリットとキャッチアップ方法
junghyeonjae
0
570
【実践】 パフォーマンス・チューニング~オプティマイザ活用術~
oracle4engineer
PRO
1
1.2k
Featured
See All Featured
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
278
13k
Scaling GitHub
holman
458
140k
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
109
6.9k
Designing on Purpose - Digital PM Summit 2013
jponch
114
6.8k
Fantastic passwords and where to find them - at NoRuKo
philnash
48
2.8k
Music & Morning Musume
bryan
46
6k
The Pragmatic Product Professional
lauravandoore
31
6.2k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Documentation Writing (for coders)
carmenintech
65
4.3k
The Illustrated Children's Guide to Kubernetes
chrisshort
47
48k
WebSockets: Embracing the real-time Web
robhawkes
59
7.3k
Intergalactic Javascript Robots from Outer Space
tanoku
268
26k
Transcript
データサイエンティスト養成読本 ビジネス活用編のこぼれ話と エンジニアとデータサイエンティストのコラボ について 2019/06/12 みんなのPython勉強会#46
誰? • 名前 : 伊藤 徹郎 (@tetsuroito) • 所属 :
Classi株式会社 データAI部 • 属性:データサイエンティスト • マイブーム:スパイスカレー • コミュニティ ◦ Data Analyst Meetup Tokyo ◦ Machine Learning Casual Talk ◦ Data Pipeline Casual Talk など
会社の宣伝
会社の宣伝
先週の話 ワタクシ
今日の話 • 去年出版した書籍(技術評論社) • DS養成読本シリーズ5作目 • 10人の著者によるオムニバス形式 • 主な内容 ◦
分析PJあるある ◦ ちょっとしたTips (Pythonどころかコードは1行も出てきません) 私が著者代表の一人です
何が書いてあるの?
何が書いてあるの? 分析プロジェクトの 機能要件ではなく、 非機能要件でつまづきや すいポイントのポエム
養成読本関連は色々記事あるので、そっち見て
閑話 休題
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 異文化理解力の重要性
最近のチームでも異なる文化の職種が多い マネジメント マーケティング エンジニアリング 製造・開発 サポート 販売 デザイン データサイエンス
データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac
データサイエンスとエンジニアリングの違い PoCやプロトをプロダクションに乗せたい 引用: https://towardsdatascience.com/research-oriented-code-in-ai-ml-projects-f0dde4f9e1ac コードのリファクタリングまった なし!
• 環境が同期してなくて動かない • Pythonっぽくないコードの書き方 • 何を計算しているかよくわからない • それ必要?.pyの存在 • Pandasが使われていてメモリが...
• 運用って言葉知ってますか? • テストコード is どこ etc ... データサイエンス系のコードのリファクタがむずい *フィクションです
リファクタリングの理解が噛み合わない例 エンジニア データサイエンティスト 可読性・効率・高速化 などのためにリファクタ Jupyterの途中結果消して 綺麗にすればいいんでしょ?
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性
• 相手の言動の真意を理解する • 自分の言動を相手がどう捉えているかを理 解する • 育った環境や価値観が異なる人と働くとき に、行き違いや誤解を生むことなく、確かな 信頼を築く技術 (再掲)異文化理解力の重要性
お互いに背景を理解する 努力をしましょう!
コミュニケーションをきちんととる • SlackなどでHRTにもとづき、普段から会話する • 心理的安全にもとづいた雑談ちょー大事 • 顔を合わせて会話する機会を作る • 炎上しない優しいPull Request
• コードを憎んで人を憎まず • 実装意図とか、その人の書き方の好みとかを知る
Google Colabでペアプロしてみる
機械学習や理論の勉強会をしてみる
達成したい目的 解決したい課題 同期 実装
• 近年の現場では多様な背景のメンバーが多い • データサイエンスPJの場合も例外じゃない • それぞれのコンテキストを読み取ろう • 粒度を変えてもそれは起きうる • 目的を念頭に適切なHowを選択しよう
まとめ
最後に PyCon US 共有会やるので、来てね!
ご静聴 ありがとう ございました