Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
続・小さく始めて大きく育てるMLOps2020 / Start small and grow ...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
chck
August 28, 2020
Programming
3.7k
3
Share
続・小さく始めて大きく育てるMLOps2020 / Start small and grow big MLOps2020
PyConJP2020
での発表資料です
chck
August 28, 2020
More Decks by chck
See All by chck
CyberAgent AI Lab研修 / Social Implementation Anti-Patterns in AI Lab
chck
6
4.3k
CyberAgent AI Lab研修 / Container for Research
chck
1
2.3k
CyberAgent AI Lab研修 / Code Review in a Team
chck
3
2.3k
論文読み会 / Socio-Technical Anti-Patterns in Building ML-Enabled Software: Insights from Leaders on the Forefront
chck
0
110
CyberAgent AI事業本部MLOps研修Container編 / Container for MLOps
chck
3
5.9k
論文読み会 / GLAZE: Protecting Artists from Style Mimicry by Text-to-Image Models
chck
0
70
論文読み会 / On the Factory Floor: ML Engineering for Industrial-Scale Ads Recommendation Models
chck
0
53
論文読み会 / GUIGAN: Learning to Generate GUI Designs Using Generative Adversarial Networks
chck
0
57
機械学習開発のためのコンテナ入門 / Container for ML
chck
0
980
Other Decks in Programming
See All in Programming
Cache-moi si tu peux : patterns et pièges du cache en production - Devoxx France 2026 - Conférence
slecache
0
280
iOS機能開発のAI環境と起きた変化
ryunakayama
0
190
2026_04_15_量子計算をパズルとして解く
hideakitakechi
0
110
Server-Side Kotlin LT大会 vol.18 [Kotlin-lspの最新情報と Neovimのlsp設定例]
yasunori0418
1
180
t *testing.T は どこからやってくるの?
otakakot
1
710
10年分の技術的負債、完済へ ― Claude Code主導のAI駆動開発でスポーツブルを丸ごとリプレイスした話
takuya_houshima
0
2.6k
ルールルルルルRubyの中身の予備知識 ── RubyKaigiの前に予習しなイカ?
ydah
1
210
AWS re:Invent 2025の少し振り返り + DevOps AgentとBacklogを連携させてみた
satoshi256kbyte
3
170
アーキテクチャモダナイゼーションとは何か
nwiizo
19
5.4k
レガシーPHP転生 〜父がドメインエキスパートだったのでDDD+Claude Codeでチート開発します〜
panda_program
0
1k
🦞OpenClaw works with AWS
licux
1
210
tRPCの概要と少しだけパフォーマンス
misoton665
2
230
Featured
See All Featured
Practical Orchestrator
shlominoach
191
11k
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.5k
Embracing the Ebb and Flow
colly
88
5k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
53k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1k
Making Projects Easy
brettharned
120
6.6k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
510
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
GraphQLとの向き合い方2022年版
quramy
50
15k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.7k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
770
Transcript
続・小さく始めて大きく育てる MLOps2020 Yuki IWAZAKI
I am Yuki Iwazaki Research Engineer at CyberAgent, AI Lab
You can find me at @chck 2014- Back/Frontend Engineer (Ruby, Scala, JavaScript) 2016- Data Scientist (Python) 2017- Research Engineer (Python) Hello! 2
What is MLOps? ML lifecycleを運用・管理 するためのPractice 3
What is ML Lifecycle? DS Projectにおける周期的なProcess - Fetch Data -
Preprocessing - Training - Reporting - Deployment https://www.slideshare.net/databricks/mlflow-infrastructure-for-a-complete-machine-learning-life-cycle 4
Fetch Data 5
Preprocessing 6
Training 7
Reporting 8
ML Lifecycleに潜む罠 9
乱立するJupyter Notebook 10
身元不明なデータ 11
再現しない学習結果 12
引き継ぎできない実験コード 13
14 実験管理 できてますか
ブログ記事: 小さく始めて大きく育てるMLOps2020 15
今日から始められる決定版を紹介したい 16
Hydra 17
Hydra 設定パラメータ管理ツール - pip install hydra-core - 複数のYamlを継承 - 順次読込
- Parameter探索にも 18
Hydra 19
Hydra 20
Hydra 21
Hydra defaults: lightgbm_a.yamlをload 22
Hydra defaults: lightgbm_a.yamlをload lightgbm_b.yamlをload 23
Hydra defaults: lightgbm_a.yamlをload lightgbm_b.yamlをload argsでparamsをoverwrite 24
Hydra Multirun Optionによる順次実行 25
MLflow Tracking 26
MLflow Tracking 実験ログの管理ツール - pip install mlflow - clientからserverに送信し たログが保存され、
UIから可視化できる 27
MLflow Tracking Tracking Server Tracking Client User 28
MLflow Tracking Tracking Serverの起動コマンド 内部でgunicornが動いている 29
MLflow Tracking 30
MLflow Tracking 実験一覧 実験結果 31
MLflow Tracking 32
MLflow Tracking before after (with mlflow) 33
MLflow Tracking before after (with mlflow) 34
MLflow Tracking before after (with mlflow) 35
MLflow Tracking 36
MLflow Tracking 37
MLflow Tracking 38
Tracking Serverのすすめ Tracking Server Tracking Client User MLflow or 実験管理系SaaS
39
Kedro 40
Kedro Workflowの管理ツール - pip install kedro - Fetch Data ->
Preprocessing -> Training -> Reporting の流れをPipeline化 41
Kedro Pipeline 42
Kedro Pipeline Data Catalog Pipeline内で共有したいDataを yamlに定義 Data Connectorとその引数を記述 built-inのCSV, SQL,
S3,,, Custom実装も可能 43
Kedro Pipeline Parameters Pipeline内で共有したいParameterを yamlに定義 Hydraとの連携やMLflowに渡す例も 44
Kedro Pipeline Node Pipelineを組み立てる処理の一単位. Python関数で記述 45
Kedro Pipeline Pipeline Data Catalog, Parameterが共有された NodeのChain 46
47
node: preprocessの実行 48
node: train_modelの実行 49
node: report_accuracyの実行 50
Summary 51
今日のまとめ Parameters Track experiments Workflow 52
おわりに 使い回しを意識した健全なML Lifecycleで 未来の自分やProjectの皆を幸せにしましょう まずは1ツールから. 53
References - 小さく始めて大きく育てるMLOps2020 - https://github.com/chck/ml-management-tools/ - ハイパラ管理のすすめ - ハイパーパラメータをHydra+MLflowで管理しよう -
MLFlowと他ツールの組み合わせ 54
You can find me at ◉ speakerdeck.com/chck ◉ github.com/chck ◉
facebook.com/chck1245 Thanks! 55 ←この発表資料
Appendix 56
Deploymentまで管理するには - こんなのがあります - library依存 - TensorFlow Serving - TorchServe
... - Cloud依存 - SageMaker - AI Platform ... 57
MLOps Yes/No Chart 58