Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ClearMLで行うAIプロジェクトの管理(レポート,最適化,再現,デプロイ,オーケストレーション)
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Ringa_hyj
December 31, 2024
Technology
250
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ClearMLで行うAIプロジェクトの管理(レポート,最適化,再現,デプロイ,オーケストレーション)
Ringa_hyj
December 31, 2024
More Decks by Ringa_hyj
See All by Ringa_hyj
DVCによるデータバージョン管理
ringa_hyj
0
400
deeplakeによる大規模データのバージョン管理と深層学習フレームワークとの接続
ringa_hyj
0
110
Hydraを使った設定ファイル管理とoptunaプラグインでのパラメータ探索
ringa_hyj
0
230
Catching up with the tidymodels.[Japan.R 2021 LT]
ringa_hyj
3
880
多次元尺度法MDS
ringa_hyj
0
380
因子分析(仮)
ringa_hyj
0
210
階層、非階層クラスタリング
ringa_hyj
0
160
tidymodels紹介「モデリング過程料理で表現できる説」
ringa_hyj
0
680
深層学習をつかった画像スタイル変換の話と今までの歴史
ringa_hyj
0
500
Other Decks in Technology
See All in Technology
AIはどのように 組織のアジリティを変えるのか?
junki
4
1k
SONiCの統計情報を取得したい
sonic
0
230
200個のGitHubリポジトリを横断調査したかった
icck
0
140
SteampipeとExcel Power QueryでAWS構成定義書の作成を自動化する
jhashimoto
0
160
あなたの知らないPDFのアクセシビリティ
lycorptech_jp
PRO
0
220
AWS Security Hub CSPMの成功・失敗体験
cmusudakeisuke
0
270
手塩にかけりゃいいってもんじゃない
ming_ayami
0
610
日本 Fintech 未来予測レポート 2027〜2028年(手動編集版)
8maki
1
2.5k
SONiCで構築・運用する生成AI向けパブリッククラウドネットワーク ~実装編~
sonic
0
280
MUSUBI 田中裕一『AIと共に行う「しごとのリデザイン」- スモールバックオフィス編』AI Ops Lab #4
musubi
0
270
Bucharest Tech Week 2026 - Guardians of the Cloud-Native Galaxy
edeandrea
PRO
0
120
Agile and AI Redmine Japan 2026
hiranabe
3
320
Featured
See All Featured
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
56k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
160
The World Runs on Bad Software
bkeepers
PRO
72
12k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.9k
Embracing the Ebb and Flow
colly
88
5.1k
How to Talk to Developers About Accessibility
jct
2
240
Six Lessons from altMBA
skipperchong
29
4.3k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
A Modern Web Designer's Workflow
chriscoyier
698
190k
Code Reviewing Like a Champion
maltzj
528
40k
Transcript
紹介 1/6 はじめに ClearMLの目的は・・・ 実験管理から本番デプロイまでの機械学習プロジェクト の全体を自動化/可視化するプラットフォーム こんな経験はありませんか? • 実験結果やモデル、パラメータの管理が煩雑で、以前の実験の再現が困難 •
複数人での実験結果や進捗状況の共有に時間がかかる • 異なる計算機で複数の処理を経由する実験過程や複雑な実験環境が再現できない • パラメータやデータを変更して性能を比較することが難しい • チーム共有のマシンでGPUリソースの使用状況が不透明 • 作成したモデルをすぐにデプロイできず困っている
紹介 2/6 チューニング/学習機能 2行のコードで実験を記録しサーバーへ保存 DataOps Tuning Train Reports Modelstore Pipelines
Deploy Reproducibility Orchestrate from clearml import Task Task.init(project_name='main_project/sub_project', task_name='test') • 容易な実行環境/結果の保存 • データ, モデルを自動or手動保存可能 • 保存モデルは別タスクから再利用可能 • 保存タスクをcloneして再実行可能 • パラメータの変更と再実行 • まとめて評価指標を比較可能 Modelstore Pipelines Deploy
紹介 3/6 DataOps機能 DataOps Tuning Train Reports Modelstore Pipelines Deploy
Reproducibility Orchestrate • データセットの登録/アップロード • 変更時に元となるデータセットとの差分の表示 • データセットの継承履歴の可視化 from clearml import Dataset dataset = Dataset.create( dataset_project="dataset_examples", dataset_name="Training Dataset") child_dataset = Dataset.create( dataset_project="dataset_examples", dataset_name="Complete Dataset", parent_datasets=[dataset.id]) Modelstore Pipelines Deploy
紹介 4/6 Reports機能 DataOps Tuning Train Reports Modelstore Pipelines Deploy
Reproducibility Orchestrate • html, マークダウン形式のレポート作成 • 実験タスクの結果から図表が引用可能 • 共有リンク生成, pdf出力への対応
紹介 5/6 Pipelines機能 DataOps Tuning Train Reports Modelstore Pipelines Deploy
Reproducibility Orchestrate • 前処理/学習/評価など分割タスクをデコレータで装飾し、一連の処理として実行可能 • パイプライン自体のcloneとデータやパラメタを変更した実験の実行が可能 • 処理ごとに実行マシンを割り当て、個別にタスク実行が可能 from clearml.automation.controller import PipelineDecorator @PipelineDecorator.component(return_values=['data_frame'], cache=True) def step_one(pickle_data_url: str, extra: int = 43): import pickle import pandas as pd from clearml import StorageManager local_iris_pkl = StorageManager.get_local_copy(remote_url=pickle_data_url) with open(local_iris_pkl, 'rb') as f: iris = pickle.load(f) data_frame = pd.DataFrame(iris['data'], columns=iris['feature_names']) return data_frame
紹介 6/6 Deploy機能 DataOps Tuning Train Reports Modelstore Pipelines Deploy
Reproducibility Orchestrate 学習用マシン ClearMLサーバー 推論用コンテナ モデル学習 モデル保存 Serving Service 推論用エンドポイント HTTP Cliant POST JSON モデル同期 • 学習したモデルをdocker, Kubernetesを利用したスケーラブルな環境で展開 • 多様なモデルタイプのサポート(Scikit-learn,XGBoost,TensorFlow,PyTorch,ONNX) • カナリアデプロイ、モデル追加や置き換えなども柔軟に実行できる