Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Pipeline Casual Talk for Ready
Search
tetsuroito
February 08, 2019
Research
1
12k
Data Pipeline Casual Talk for Ready
20190213 Data Pipeline Casual Talk @エムスリーのオープニングトーク資料です。
tetsuroito
February 08, 2019
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.8k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
850
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
630
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
5.8k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.8k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
140
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.5k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.9k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
tetsuroito
3
3.3k
Other Decks in Research
See All in Research
SSII2025 [SS1] レンズレスカメラ
ssii
PRO
2
760
SkySense : A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery
satai
3
170
2025年度人工知能学会全国大会チュートリアル講演「深層基盤モデルの数理」
taiji_suzuki
22
11k
電力システム最適化入門
mickey_kubo
1
540
Cross-Media Information Spaces and Architectures
signer
PRO
0
220
20250226 NLP colloquium: "SoftMatcha: 10億単語規模コーパス検索のための柔らかくも高速なパターンマッチャー"
de9uch1
0
430
Type Theory as a Formal Basis of Natural Language Semantics
daikimatsuoka
1
170
BtoB プロダクトにおけるインサイトマネジメントの必要性 現場ドリブンなカミナシがインサイトマネジメントに取り組むワケ / Why field-driven Kaminashi is working on insight management
kaminashi
1
440
EarthMarker: A Visual Prompting Multimodal Large Language Model for Remote Sensing
satai
3
250
学生向けアンケート<データサイエンティストについて>
datascientistsociety
PRO
0
1.9k
DeepSeek-R1の論文から読み解く背景技術
personabb
3
620
CHaserWeb:ブラウザ上で動作する対戦型プログラミング学習環境の提案と評価 / i2025-inoue
yumulab
0
160
Featured
See All Featured
Optimizing for Happiness
mojombo
378
70k
YesSQL, Process and Tooling at Scale
rocio
172
14k
Music & Morning Musume
bryan
47
6.5k
It's Worth the Effort
3n
184
28k
How GitHub (no longer) Works
holman
314
140k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
45
9.6k
Why You Should Never Use an ORM
jnunemaker
PRO
56
9.4k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.3k
The World Runs on Bad Software
bkeepers
PRO
68
11k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
45
7.3k
Transcript
Data Pipeline Casual Talk for Ready 2019/02/13(Wed) @エムスリー
何者ですか? • 名前:伊藤 徹郎 (@tetsuroito) • 所属:Classi株式会社 AI室 データサイエンティスト •
分野:Educational Technology , Learning Analytics • 著書:データサイエンティスト養成読本ビジネス活用編 • 運営: ◦ Machine Learning Casual Talks ◦ Data Analyst Meetup Tokyo など
カジュアルとは 引用 https://twitter.com/con_mame/status/457130929270435840
#DPCTの狙い データ活用のコモディティ化がだいぶ浸透した ガートナー・ハイプサイクル 2018の図は https://japan.zdnet.com/article/35126917/ より引用
#DPCTの狙い • すべてのリソースとなる「データ」 • 活用の必要性は周知の通り • 21世紀の石油と形容されることもある • ビッグデータと称し、「量」が重視される •
GPUなどの計算リソースなどの進化 などなど
#DPCTの狙い そのデータの生成過程知ってますか? 誰がどうやって利用可能なデータにして いますか? 品質を上げるための苦労を知ってます か? それを担っているのは誰ですか? どんなスキルや経験が必要ですか? どんなツールがありますか? え、機械学習に使いたいって?
・・・
#DPCTの狙い • データの処理工程であるパイプラインがまだ軽視されている • パイプラインの技術情報の共有 • 活用へのパイプライン、機械学習へのパイプライン(MLパイプライン) • 様々なツールの情報 •
担い手のスキル情報 • チームビルディング • 運用における課題 etc こんなことをカジュアルに話すのは#DPCTです!
登壇者だけでなく、 参加者のみなさんからの活発な議論を よろしくお願いします!
大好評のため、次回も開催したいと思います。 発表者および会場を募集します。 よろしくお願いします。
Appendix:申込者属性集計(複数回答可)
Appendix:DPCTに期待すること
Appendix:DPCTに期待すること