Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MLOpsはDevOpsと何が違うの?
Search
shibuiwilliam
July 21, 2022
Technology
1
340
MLOpsはDevOpsと何が違うの?
Developers Summit 2022 Summer(デブサミ2022夏)の登壇資料です。
shibuiwilliam
July 21, 2022
Tweet
Share
More Decks by shibuiwilliam
See All by shibuiwilliam
生成AIを作るエンジニアリングと使うエンジニアリング
shibuiwilliam
2
43
AI Agentのキャッシュ、再利用、Ops
shibuiwilliam
2
92
生成AIのためのデータ収集とデータエンジニアリング
shibuiwilliam
5
590
LLMで推論するライブラリを整理する
shibuiwilliam
6
1.6k
生成AIの研究開発を事業につなげる データ、仕組み、コミュニケーション
shibuiwilliam
2
110
デプロイして本番システムで使うことから考えるAI
shibuiwilliam
3
720
今日からRAGを 始めることを考える
shibuiwilliam
3
1.7k
2024年生成AI新年会登壇資料
shibuiwilliam
1
360
Creative as Software Engineering
shibuiwilliam
3
680
Other Decks in Technology
See All in Technology
20250612_GitHubを使いこなすためにソニーの開発現場が取り組んでいるプラクティス.pdf
osakiy8
1
720
AIエージェントのフレームワークを見るときの個人的注目ポイント
os1ma
1
520
AWS全冠したので振りかえってみる
tajimon
0
130
Text-to-SQLの評価データセットを作って最新LLMモデルの性能評価をしてみた
gotalab555
3
770
doda開発 生成AI元年宣言!自家製AIエージェントから始める生産性改革 / doda Development Declaration of the First Year of Generated AI! Productivity Reforms Starting with Home-grown AI Agents
techtekt
0
130
AIコーディング新時代を生き残るための試行錯誤 / AI Coding Survival Guide
tomohisa
9
12k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
7.2k
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
770
Roo CodeとClaude Code比較してみた
pharma_x_tech
2
310
kubellが挑むBPaaSにおける、人とAIエージェントによるサービス開発の最前線と技術展望
kubell_hr
0
260
New Cache Hierarchy for Container Images and OCI Artifacts in Kubernetes Clusters using Containerd / KubeCon + CloudNativeCon Japan
pfn
PRO
0
150
Devin(Deep) Wiki/Searchの活用で変わる開発の世界観/devin-wiki-search-impact
tomoki10
0
290
Featured
See All Featured
Optimising Largest Contentful Paint
csswizardry
37
3.3k
Making Projects Easy
brettharned
116
6.2k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.2k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Art, The Web, and Tiny UX
lynnandtonic
299
21k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Code Review Best Practice
trishagee
68
18k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
16
910
Building a Scalable Design System with Sketch
lauravandoore
462
33k
Adopting Sorbet at Scale
ufuk
77
9.4k
Transcript
MLOpsはDevOpsと何が違うの? 澁井 雄介 shibui yusuke
自己紹介 shibui yusuke ▶ Launchable Inc. ソフトウェアエンジニア ▶ MLOpsコミュニティ運営 ▶
もともとクラウド基盤の開発、運用。 ▶ ここ6年くらいMLOpsで仕事。 ▶ Github: @shibuiwilliam ▶ 最近やってること: 本を書いてます cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知
本日の流れ ▶ DevOps and MLOps ▶ DevOps for ML
DevOps and MLOps
DevOps
MLOpsとは ▶ DevOps for ML or ML operations ▶ 機械学習という確率的、データ依存、発展途上、便利な技術を
DevOpsに組み込む ▶ いわゆる機械学習基盤や機械学習パイプラインだけでなく、要件定義、インフ ラ、データ管理、サービング、コスト、品質、組織論まで含む 広範な概念に成長中
DevOps for ML??? M L ML ML M L ML
M L ML M L 雑にMLを入れればMLOpsになるわけではない。 ML
DevOps for ML
機械学習を使ったプロダクト例 画像処理 写真を撮る タイトル入力 説明入力 登録する 自然言語処理 違反検知 登録情報から違反を フィルタリング
入力情報から 入力補助 超解像による 画質改善 ねこ 検索 ランク学習による 並べ替え あるコンテンツ登録アプリ 画像分類と 検索
違反検知を例に考える 写真を撮る タイトル入力 説明入力 登録する 違反検知 登録情報から違反を フィルタリング ねこ あるコンテンツ登録アプリ
違反とは 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 公序良俗に反する画像 著作権違反の画像 グロテスクな画像
サービスに則さない画像 ・・・を違反として排除したい
開発の前にデータ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ DATA 機械学習には大量のデータが必要 •
集める • 意味付ける • 管理する 正常 違反 集める 意味付ける 管理する
実験して性能を評価する 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ DATA 実験を繰り返して性能を評価する。 必要に応じてDataやPlanに戻る。
ここでGPUや分散処理→コスト増大。 正常 違反 性能が低い データが足りない 遅い 実験 戻る
実験的なコード:頻繁に書き直す、 途中から実行、使い捨て 本番コード: 動かし続ける、再現性、 デバッグ 実験的なコードを清書する 写真を撮る タイトル入力 説明入力 登録する
ねこ あるコンテンツ登録アプリ 正常 違反 実験 DATA 動かし方がわからない・・・
しかしそれは始まりでしかなかった・・・ リリース・・・ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 正常 違反
実験 DATA
偽陽性と偽陰性 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 実験 DATA 偽陽性:違反なのに正常と判定
偽陰性:正常なのに違反と判定 データの品質や網羅性が足りないと、 偽陽性や偽陰性が高くなる 正常なのに 違反と判定された 投稿者は不快 閲覧者は不快 違反なのに 正常扱い
ヒューマンインザループ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 実験 DATA 自動化が進んだ仕組みにおいて、
一部の判断に人間を介在させること。 機械学習の誤りを正すためには人間の ダブルチェックが必要。 正常 違反 違反と間違えや すい正常 正常と間違えや すい違反 人間
正常 違反 推測するな計測せよ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 実験
DATA 機械学習の判定と実用上の価値を評価する。 評価に応じて次のActionを決める。 人間 評価 正答率: xx Precision: yy Recall: zz 違反画像閲覧数: aa クレーム数: bb コスト: cc Go: 改善Plan No Go: 停止措置
DevOps for ML 実験 DATA 人間 評価
▶ AIエンジニアのための 機械学習システムデザインパターン ▶ 2021年5月17日出版 ▶ https://www.amazon.co.jp/dp/4798169447/ ▶ 続編執筆中! ▶
2022年11月発売予定!? ▶ 機械学習で需要予測、違反検知、検索を実 現するシステムの作り方を解説 出版しました! ?
参考資料 ▶ MLOps: Continuous delivery and automation pipelines in machine
learning https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning ▶ Introduction to MLOps https://speakerdeck.com/asei/introduction-to-mlops ▶ Machine Learning Operations (MLOps): Overview, Definition, and Architecture https://arxiv.org/abs/2205.02302 ▶ People + AI Research https://pair.withgoogle.com/ ▶ Awesome MLOps https://github.com/visenger/awesome-mlops ▶ AIシステムが成熟する今「 MLOps」が必要とされる理由とは? MLOpsを推進するために大切なこと https://codezine.jp/article/detail/15953
Thank you!