Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Pipeline Casual Talk for Ready
Search
tetsuroito
February 08, 2019
Research
1
12k
Data Pipeline Casual Talk for Ready
20190213 Data Pipeline Casual Talk @エムスリーのオープニングトーク資料です。
tetsuroito
February 08, 2019
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.8k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
830
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
620
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
5.7k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.8k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
130
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.4k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.9k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
tetsuroito
3
3.2k
Other Decks in Research
See All in Research
Pix2Poly: A Sequence Prediction Method for End-to-end Polygonal Building Footprint Extraction from Remote Sensing Imagery
satai
3
270
実行環境に中立なWebAssemblyライブマイグレーション機構/techtalk-2025spring
chikuwait
0
140
3D Gaussian Splattingによる高効率な新規視点合成技術とその応用
muskie82
0
440
Prithvi-EO-2.0: A Versatile Multi-Temporal Foundation Model for Earth Observation Applications
satai
3
330
20250226 NLP colloquium: "SoftMatcha: 10億単語規模コーパス検索のための柔らかくも高速なパターンマッチャー"
de9uch1
0
320
データサイエンティストの採用に関するアンケート
datascientistsociety
PRO
0
500
JSAI NeurIPS 2024 参加報告会(AI アライメント)
akifumi_wachi
5
950
rtrec@dbem6
myui
6
720
Weekly AI Agents News!
masatoto
33
62k
NLP2025SharedTask翻訳部門
moriokataku
0
270
Batch Processing Algorithm for Elliptic Curve Operations and Its AVX-512 Implementation
herumi
0
140
BtoB プロダクトにおけるインサイトマネジメントの必要性 現場ドリブンなカミナシがインサイトマネジメントに取り組むワケ / Why field-driven Kaminashi is working on insight management
kaminashi
1
380
Featured
See All Featured
GraphQLの誤解/rethinking-graphql
sonatard
71
10k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
13
680
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Music & Morning Musume
bryan
47
6.5k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
23
2.6k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
9
760
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
227
22k
Building Applications with DynamoDB
mza
94
6.3k
We Have a Design System, Now What?
morganepeng
52
7.5k
Visualization
eitanlees
146
16k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
21k
Transcript
Data Pipeline Casual Talk for Ready 2019/02/13(Wed) @エムスリー
何者ですか? • 名前:伊藤 徹郎 (@tetsuroito) • 所属:Classi株式会社 AI室 データサイエンティスト •
分野:Educational Technology , Learning Analytics • 著書:データサイエンティスト養成読本ビジネス活用編 • 運営: ◦ Machine Learning Casual Talks ◦ Data Analyst Meetup Tokyo など
カジュアルとは 引用 https://twitter.com/con_mame/status/457130929270435840
#DPCTの狙い データ活用のコモディティ化がだいぶ浸透した ガートナー・ハイプサイクル 2018の図は https://japan.zdnet.com/article/35126917/ より引用
#DPCTの狙い • すべてのリソースとなる「データ」 • 活用の必要性は周知の通り • 21世紀の石油と形容されることもある • ビッグデータと称し、「量」が重視される •
GPUなどの計算リソースなどの進化 などなど
#DPCTの狙い そのデータの生成過程知ってますか? 誰がどうやって利用可能なデータにして いますか? 品質を上げるための苦労を知ってます か? それを担っているのは誰ですか? どんなスキルや経験が必要ですか? どんなツールがありますか? え、機械学習に使いたいって?
・・・
#DPCTの狙い • データの処理工程であるパイプラインがまだ軽視されている • パイプラインの技術情報の共有 • 活用へのパイプライン、機械学習へのパイプライン(MLパイプライン) • 様々なツールの情報 •
担い手のスキル情報 • チームビルディング • 運用における課題 etc こんなことをカジュアルに話すのは#DPCTです!
登壇者だけでなく、 参加者のみなさんからの活発な議論を よろしくお願いします!
大好評のため、次回も開催したいと思います。 発表者および会場を募集します。 よろしくお願いします。
Appendix:申込者属性集計(複数回答可)
Appendix:DPCTに期待すること
Appendix:DPCTに期待すること