機械学習実用化失敗黙示録

機械学習実用化失敗黙示録 2022/04/20 しぶい

自己紹介 shibui yusuke • いろいろ → Launchable（いまここ） • MLOpsとかいろいろエンジニア •
もともとクラウド基盤の開発、運用 • ここ6年くらいMLOpsとバックエンドとインフラとたまにデータ分析とAndroidで仕事 • Github: @shibuiwilliam • FB: yusuke.shibui • Meety: https://meety.net/matches/OPJgijxiEMHE • 最近の趣味：本の執筆と副業と ARとネコ cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知 2

MLOps勉強会を毎月開催してます！ https://mlops.connpass.com/

ワシの失敗談は百八式まであるぞ • 成功の裏には多くの失敗が存在する。 • 成功しなくても多くの失敗は存在する。 • 機械学習の実用化関係の仕事を続けてきて犯した大小の失敗のうち、代表的な1個を説明します。

機械学習を実用化するためのエンジニアリング学習コード学習データ学習評価モデルレポート推論
コード CI テストデータ評価コード CD システム A A/B テストシステム B 負荷試験ログ収集評価データユニットテストユニットテスト機械学習エンジニアが得意ソフトウェアエンジニアが得意 SREが得意

機械学習を実用化するためのエンジニアリング学習コード学習データ学習評価モデルレポート推論
コード CI テストデータ評価コード CD システム A A/B テストシステム B 負荷試験ログ収集評価データユニットテストユニットテスト機械学習エンジニアが得意ソフトウェアエンジニアが得意 SREが得意機械学習のエンジニアリングには機械学習の知識が必要

0->1 フェーズのよくある失敗全部できるスーパーエンジニアが全部作る・・・けど作るだけで終わる機械学習を実用化するためのエンジニアリング学習コード学習データ学習
評価モデルレポート推論コード CI テストデータ評価コード CD システム A A/B テストシステム B 負荷試験ログ収集評価データユニットテストユニットテスト機械学習エンジニアが得意ソフトウェアエンジニアが得意 SREが得意

機械学習黎明期に謎の機械学習システムが出来上がるコード管理 DWH CI CRD 学習パイプラインビルドパイプラインマイクロサービス
CRD デプロイパイプライン CRD 学習クラスターサービスクラスター cron リソースコントローラ

チームメンバーモチベーション俺は0->1が得意！新しいプロダクトを考えたよ♪ どうにか運用せねば・・・作った人の尻拭いは嫌だ。無駄に複雑で不安定だし。
作った人 PdM EM

作り直すことのエンジニアリング • 目標を立てる：チームメンバーが技術選定して小さな変更でまともな運用を目指す ◦ 独自パイプラインCRDをマネージドサービスとサーバレスに寄せる • モチベーションを作る：作ったときに存在しなかった新しい技術を取り入れる ◦ Vertex AIやMLflowの導入
• フルスタックを目指さない：エンジニアとして今得たい技術に集中する ◦ 機械学習Kubernetesクラスターをインフラチームクラスターに移行 • 技術的負債をビジネス的に説明する：運用負荷を下げたほうが開発効率は上がる ◦ 開発vs運用工数の指標化

開発のチームワークはフェーズによって異なる機械学習導入開始実用化開発自動化リリース自動化機械学習エンジニア一人機械学習
エンジニア複数機械学習エンジニア + バックエンドエンジニアプロダクト別・事業別チーム頑張れ！一番自由な時期！阿吽の呼吸でわいわい楽しい ♪ 軋轢が生まれ始めるコード品質 vs Jupyter 各チームの独自運用他チームはあまり知らないスーパーエンジニアレガシー企業は実はこのステージが多い動いてるけどメンテナンスが難しいことが多いバックエンドエンジニアの支援がありがたいフェーズ素晴らしいチームワーク！

学び • 作りたいものや作ってほしいものが、本当に作るべきものとは限らない。 • 作り直しは必ず発生する。新技術を扱ったプロダクトでは特に。 • 組織とプロダクトのフェーズによって突破志向と安定志向を使い分ける。

昨年出版した本の宣伝 • AIエンジニアのための機械学習システムデザインパターン • 2021年5月17日発売 • https://www.amazon.co.jp/dp/4798169447/ • 機械学習よりもKubernetesとIstioに詳しくなれる一冊！
• Amazon.co.jp 情報学・情報科学部門　 1位！人工知能部門　1位！ • 韓国語版も発売中！ • 英語版出したい！

機械学習実用化失敗黙示録

機械学習実用化失敗黙示録

shibuiwilliam

More Decks by shibuiwilliam

Other Decks in Programming

Featured

Transcript