Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LLMOps: Eval-Centric を前提としたMLOps

LLMOps: Eval-Centric を前提としたMLOps

LLM Night〜LLMアプリケーションの評価の実運用〜 の登壇資料です
https://yojo.connpass.com/event/335365/

Asei Sugiyama

November 23, 2024
Tweet

More Decks by Asei Sugiyama

Other Decks in Technology

Transcript

  1. 自己紹介 杉山 阿聖 (@K_Ryuichirou) Software Engineer @ Citadel AI Google

    Cloud Innovators Champion @ Cloud AI/ML MLSE 機械学習オペレーション WG mlops community 運営 機械学習図鑑 事例でわかる MLOps 共著 決闘者 @ マスターデュエル
  2. MLOps で取り組む課題 前処理が難しい モデルの更新などの運用 が煩雑 機械学習チームの悲劇 西田 佳史, 遠藤 侑介,

    有賀 康顕 著 「n 月刊ラムダノート Vol.1, No.1(2019)」 ラムダノート株式会社 2019年 https://eiyo21.com/book/9784789554596/
  3. MLOps のベストプラク ティス 事例でわかる MLOps 技術・プロセス・文化 活用フェーズごとに整理 杉山 阿聖, 太田

    満久, 久井 裕貴 編著 「事例でわかるMLOps 機械学習の成果 をスケールさせる処方箋」 講談社 2024年 https://www.kspub.co.jp/book/detail/5369562.html
  4. 継続的な改善 DevOps の原 則のひとつ フィードバッ クサイクルに よる改善 Explore Continuous Improvement

    - Training | Microsoft Learn https://learn.microsoft.com/en- us/training/modules/characterize-devops- continous-collaboration-improvement/3-explore- continuous-improvement
  5. 継続的な訓練 MLOps にお ける継続的な 改善の実装 モデルを継続 的に訓練して 改善 MLOps: Continuous

    delivery and automation pipelines in machine learning | Cloud Architecture Center | Google Cloud https://cloud.google.com/architecture/mlops- continuous-delivery-and-automation-pipelines-in- machine-learning
  6. LLMOps 再考 既存の LLMOps 既存の LLMOps の問題点 市場調査 LLM の活用における課題

    Eval-Centric AI LLMOps の取り組み 継続的な評価 フレームワークの検証
  7. 既存の LLMOps LLM の出現時に LLMOps というドキュメントが出 現した 既存の MLOps のプラクテ

    ィスを LLM に適用するも の LLMOps: What it is and how it works | Google Cloud https://cloud.google.com/discover/what-is-llmops?hl=en
  8. 既存の LLMOps の問題点 MLOps は CT (継続的な訓練) を中心とした継続的な改善 LLM の活用においては

    CT を前提とできないため、フィードバック ループを構成できていない 解決したい課題を明確にしないままに MLOps をベースに定義して しまった
  9. プロンプトエンジニアリング 入力文章を調整して、言語モ デルを効率的に使おうとする 手法群 指示文を人が見たときにわか りやすくなるよう、明確に記 述することが基本 Gemini の記事が参考になる CoT

    (Chain of Thought) などの テクニックもある Gemini から欲しい回答を引き出すプロンプト術|Gemini - Google の AI https://note.com/google_gemini/n/n60a9c426694e
  10. まとめ MLOps は機械学習の成果をスケールさせるためのさまざまな取り 組み MLOps のプラクティスのひとつである継続的な訓練は継続的な改 善を実現させるためのもの LLM の活用においては Eval-Centric

    なアプローチが必要であり、評 価を通じた改善サイクルの再定義が必要 LLM-as-a-Judge などの技術を用いて、品質評価の観点をイテレー ティブに獲得する継続的な評価が鍵