Lets start mlops

今日から始める MLOps 2021/07/29 shibui yusuke 1

自己紹介 shibui yusuke • ティアフォーでよろず屋兼イベント係 • MLOpsコミュニティのオーガナイザー • もともとクラウド基盤の開発、運用。 •
ここ5年くらいMLOpsで仕事。 • Github: @shibuiwilliam • Qiita: @cvusk • FB: yusuke.shibui • 最近やってること: Golangとデータ分析とBI cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知 2

今日話すこと • 最近よく聞く「MLOps」について説明します。 • ティアフォーで取り組んでいる事例とともに、 MLOpsの進め方を紹介します。 3

CatOps! 放置しているとネコに椅子を奪われる。ネコ障害対応（餌、遊ぶ）。「遊ぶ」を自動化する。椅子に座っていてもハンズフリーで遊べる。 day 奪わ
れ回数ハンズフリー導入飽き始める Dev Data-driven 4 Ops

なぜ機械学習に DevOpsが必要か 5

• PoCから次の段階に行くためには機械学習のDevOpsが必要 • 機械学習を含むプロダクトの価値を継続的に引き出すのがMLOps 0->1の次を目指す PoCの数々ようやく成功したプロダクトやモデル実用レベルに品質を上げるには
なにが必要？ • 実用上の指標から機械学習を評価する • 機械学習だけにフォーカスしない • データシステムの全体戦略を作る 6

機械学習を使ったプロダクト例信号認識信号機を検知し、色を判別 20m 物体検知画像認識色認識前処理地図 →赤！
7

機械学習を使ったプロダクトをDevOpsする 8

MLOpsの始め方 9

課題解決を導くライフサイクルを設計する • 課題 • 制約条件 • 成功の定義データ収集データ分析データ生成
学習評価実用化ビルド実装 10

課題解決を導くライフサイクルを設計する • 課題路上で信号機を検知し、正確に認識する必要がある。 • 制約条件計算リソースに制限がある。全国のデータを得ることはできない。 •
成功の定義 **m手前から信号機の位置と色を **%正確に認識できる。データ収集データ分析データ生成学習評価実用化ビルド実装データの収集アノテーション実験抽出、選択整理 ETL モデル開発テスト、分析不足データの収集実践 11

ライフサイクルに必要なリソースを実現するデータ収集データ分析データ生成学習評価実用化ビルド実装デ
ータの収集アノテーション実験抽出、選択整理 ETL モデル開発テスト、分析不足データの収集実践クラウドデータ基盤データ検索アノテータ学習基盤分析・CI/CD 組み込みセンサー自動車モデル管理 12

課題解決に対する因果関係を明確にするデータ収集データ分析データ生成学習評価実用化ビルド実装デ
ータの収集アノテーション実験抽出、選択整理 ETL モデル開発テスト、分析不足データの収集実践クラウドデータ基盤データ検索アノテータ学習基盤分析・CI/CD 組み込みセンサー自動車モデル管理認識精度を上げるためにはモデル開発が必要認識精度を評価する仕組み良いモデルには抜け漏れのないデータが必要 13

データ検索、コードテスト、モデル管理 14

データ検索 15

データに依存する課題を抽出する夜夕方逆光影バック雨粒暗がり雪大通り
周囲にビル出入り口青空直線 16

データ課題を解決するために基盤と検索を整備する PROJECT - id - project_name - description PLACE -
id - country - prefecture - city WEATHER - id - weather_name - place_id - start_time - end_time IMAGE - id - ﬁle_name - recorded_time - project_id - place_id - latitude - longitude OBJECT - image_id - people - cars - bicycles - buses - traﬃc_lights DARKNESS - image_id - darkness - brightness 17

検索 18

コードテスト 19

開発の品質を維持しつつスケールする仕組みを作る取得したデータが正しい → ←この処理が正しい動くモデルができてる → データリークしていない → ←基準以上の評価評価と実用が乖離しない
→ 止めずに安定して動かせるデータ取得前処理学習評価ビルド ←損失関数が下がる動く→ 20

tldr; テストを書こう！取得したデータが正しい → ←この処理が正しい動くモデルができてる → データリークしていない → ←基準以上の評価
評価と実用が乖離しない → 止めずに安定して動かせるデータ取得前処理学習評価ビルド ←損失関数が下がる動く→ ↑Data validation ↓ユニットテスト ↓early stopping ↓分析システムテスト→ ↑接続テスト Data validation→ 接続テスト↓ 分析→ 21

• ソフトウェア開発ではプログラムを通してロジックをテストする • 機械学習ではコードを通してデータで確率をテストするデータモデル以外もテストする YES or NO 0
~ 1 ソフトウェア開発のテスト機械学習のテスト入力正解出力 assert 関数指標推論 evaluate モデル関数テスト通過率：95/100 Accuracy：0.99 Precision：0.95 Recall：0.60 22

テストのイメージ # 仮のコードです def make_dataloader(data_path: str) -> DataLoader: return dataloader(data_path)
def train(model: nn.Module, epochs: int, trainloader: DataLoader) -> List[ﬂoat]: losses = [] for epoch in range(epochs): average_loss = train_once(model, trainloader) losses.append(average_loss) model.save() return losses def evaluate(model_path: str, testloader: DataLoader) -> List[ﬂoat]: predictor = Model(model_path) evaluations = predictor.evaluate(testloader) return evaluations • 少量データで普通のテストを動かす。 @pytest.mark.parametrize( (“model”, “train_path”, “test_path” “epochs”), [(model, “/tmp/small_train/”, “/tmp/small_test/”, 10)], ) def test_train( model: nn.Module, train_path: str, test_path: str, epochs: int, ): trainloader = make_dataloader(train_path) testloader = make_dataloader(test_path) init_accuracy = evaluate(model, testloader) losses = train(model, epochs, trainloader) assert losses[0] > losses[-1] trained_accuracy = evaluate(model, testdata) assert init_accuracy < trained_accuracy 23

モデル管理 24

モデルを管理する 25 データ取得前処理学習評価データ基盤ストレージテストデータアーティファクト
管理 Docker registry 25 PROJECT - project_id - project_name - description MODEL - model_id - project_id - model_name - description EXPERIMENT - experiment_id - model_id - algorithm - parameters - metrics - evaluations - artifacts

モデルを管理し、分析する 26 26 晴天夜雨数字はサンプル晴天夜雨
{ 'data_id': 'ABCD1234', 'algorithm': 'mobilenetv2', 'optimizer': 'Adam', 'learning_rate': 0.001, 'batch_size': 32, 'epochs': 300, } { 'data_id': 'EFGH5678', 'algorithm': 'mobilenetv2', 'optimizer': 'Adam', 'learning_rate': 0.005, 'batch_size': 16, 'epochs': 200, }

まとめ 27

ティアフォー　MLOpsエンジニア募集中！ https://herp.careers/v1/tier4/zHA-dVY6ORa4 • 2Dや3Dの物体検出モデル開発および基盤開発 • KubernetesおよびAWSインフラの構築、運用 • Deep Learningのモデル最適化および推論器開発 •
Deep LearningのためのシミュレーションとCI/CD • データパイプライン、データ基盤、検索 • 技術的に難しいことすべて 28

本を出版しました！ • AIエンジニアのための機械学習システムデザインパターン • 2021年5月17日出版 • https://www.amazon.co.jp/dp/4798169447/ • Amazon.co.jp ◦
情報学・情報科学部門　 1位！ ◦ 人工知能部門　1位！ ◦ 増刷決定！ • 中国語版と韓国語訳も出るらしい！ 29

機械学習を使ったプロダクト例 30

データに依存する課題を抽出する 31

機械学習を使ったプロダクトをOpsするデータ収集と整理、検索フィードバックとロジック開発実装と実験 32

Lets start mlops

Lets start mlops

shibuiwilliam

More Decks by shibuiwilliam

Other Decks in Technology

Featured

Transcript

今日から始める MLOps 2021/07/29 shibui yusuke 1

自己紹介 shibui yusuke • ティアフォーでよろず屋兼イベント係 • MLOpsコミュニティのオーガナイザー • もともとクラウド基盤の開発、運用。 •

今日話すこと • 最近よく聞く「MLOps」について説明します。 • ティアフォーで取り組んでいる事例とともに、 MLOpsの進め方を紹介します。 3

CatOps! 放置しているとネコに椅子を奪われる。ネコ障害対応（餌、遊ぶ）。「遊ぶ」を自動化する。椅子に座っていてもハンズフリーで遊べる。 day 奪わ

なぜ機械学習に DevOpsが必要か 5

• PoCから次の段階に行くためには機械学習のDevOpsが必要 • 機械学習を含むプロダクトの価値を継続的に引き出すのがMLOps 0->1の次を目指す PoCの数々ようやく成功したプロダクトやモデル実用レベルに品質を上げるには

機械学習を使ったプロダクト例信号認識信号機を検知し、色を判別 20m 物体検知画像認識色認識前処理地図 →赤！

機械学習を使ったプロダクトをDevOpsする 8

MLOpsの始め方 9

課題解決を導くライフサイクルを設計する • 課題 • 制約条件 • 成功の定義データ収集データ分析データ生成

課題解決を導くライフサイクルを設計する • 課題路上で信号機を検知し、正確に認識する必要がある。 • 制約条件計算リソースに制限がある。全国のデータを得ることはできない。 •

ライフサイクルに必要なリソースを実現するデータ収集データ分析データ生成学習評価実用化ビルド実装デ

課題解決に対する因果関係を明確にするデータ収集データ分析データ生成学習評価実用化ビルド実装デ

データ検索、コードテスト、モデル管理 14

データ検索 15

データに依存する課題を抽出する夜夕方逆光影バック雨粒暗がり雪大通り

データ課題を解決するために基盤と検索を整備する PROJECT - id - project_name - description PLACE -

検索 18

コードテスト 19

開発の品質を維持しつつスケールする仕組みを作る取得したデータが正しい → ←この処理が正しい動くモデルができてる → データリークしていない → ←基準以上の評価評価と実用が乖離しない

tldr; テストを書こう！取得したデータが正しい → ←この処理が正しい動くモデルができてる → データリークしていない → ←基準以上の評価

• ソフトウェア開発ではプログラムを通してロジックをテストする • 機械学習ではコードを通してデータで確率をテストするデータモデル以外もテストする YES or NO 0

テストのイメージ # 仮のコードです def make_dataloader(data_path: str) -> DataLoader: return dataloader(data_path)

モデル管理 24

モデルを管理する 25 データ取得前処理学習評価データ基盤ストレージテストデータアーティファクト

モデルを管理し、分析する 26 26 晴天夜雨数字はサンプル晴天夜雨

まとめ 27

ティアフォー　MLOpsエンジニア募集中！ https://herp.careers/v1/tier4/zHA-dVY6ORa4 • 2Dや3Dの物体検出モデル開発および基盤開発 • KubernetesおよびAWSインフラの構築、運用 • Deep Learningのモデル最適化および推論器開発 •

本を出版しました！ • AIエンジニアのための機械学習システムデザインパターン • 2021年5月17日出版 • https://www.amazon.co.jp/dp/4798169447/ • Amazon.co.jp ◦

機械学習を使ったプロダクト例 30

データに依存する課題を抽出する 31

機械学習を使ったプロダクトをOpsするデータ収集と整理、検索フィードバックとロジック開発実装と実験 32