Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LLMOpsのこれまでとこれからを学ぶ

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.
Avatar for Satsuki Nagae Satsuki Nagae
February 16, 2026

 LLMOpsのこれまでとこれからを学ぶ

渋谷 Biz × AI: ビジネスにおける AI 利活用 事例勉強会 第4回の発表資料です。
- MLOps / LLMOps -https://sansan.connpass.com/event/380668/

Avatar for Satsuki Nagae

Satsuki Nagae

February 16, 2026
Tweet

More Decks by Satsuki Nagae

Other Decks in Technology

Transcript

  1. *1 LARGE LANGUAGE MODELS AS OPTIMIZERS *2 Apparently, ChatGPT gives

    you better responses if you (pretend) to tip it for its work. The bigger the tip, the better the service. *3 Large Language Models Understand and Can be Enhanced by Emotional Stimuli *4 26 prompt principles 2023年のプロンプトエンジニアリング 流行った「おまじない」テクニック ・深呼吸させる *1 ・チップを渡す *2 ・感情に訴える *3 ・脅迫する *4
  2. 2023年のファインチューニング A Survey of Techniques for Maximizing LLM Performance. OpenAI

    (2023) モデルの動作を最適化するのに、 ファインチューニングは有効な手段として位置付けられてた LLMアプリケーションの最適化の流れ
  3. 2023年のファインチューニング 2023: The State of Generative AI in the Enterprise

    ファインチューニングが最適化手法として活用されていた 本番運用されているAIアプリケーションの最適化手法
  4. 2023年のファインチューニング FMOps/LLMOps:生成系 AI の運用と MLOps との違い | Amazon Web Services

    2023年9月8日公開 LLMOps:基盤モデルに基づくアプリケーション開発のワー クフロー|Weights & Biases Japan 2023年7月13日公開 LLMOpsをLLMフルスクラッチ開発、ファインチューニング、モデルAPI活用の 3タイプに分類して考えられることが多い
  5. 推論コストに対するモデル性能が向上 The cost of AI reasoning is going to drastically

    decrease. Fig 1 推論コストとモデル性能 同じ推論コストでより性能の良いモデルが利用可能になった
  6. 職業プロンプトエンジニアの需要減少 ・LinkedIn プロンプトエンジニアの求人数が、2024年から2025年にかけて40%減少 The Hottest AI Job of 2023 Is

    Already Obsolete ・indeed 検索全体100万件に対するプロンプトエンジニアの検索数が、 2023年は144件だったのが、2025年は20件に減少 The Decline of Prompt Engineering and the Rise of Process Automation Skills 

  7. モデル開発からモデルAPI活用に変化 2025: The State of Generative AI in the Enterprise

    2024年と2025年の自社モデル運用、モデルAPI活用の比率 モデルAPIが安く、性能が良くなり、モデルAPI活用の割合が増加した
  8. ファインチューニングを活用する組織が減少した 2025: The State of Generative AI in the Enterprise

    エンタープライズ企業とスタートアップの使用している最適化手法(2025年版) ファインチューニングは主要な最適化手法ではなくなり(※2023年は19%)、 コンテクストエンジニアリング、ツール呼び出しが増加
  9. 2025年8月以降のイベント 8月6日 Claude Opus 4.1 12月11日 GPT-5.2 8月7日 GPT-5 9月29日

    Agent SDK 10月13日 Amazon Bedrock AgentCore 11月18日 Gemini 3.0 11月24日 Claude Opus 自律型エージェント能力を持つ モデルのリリース エージェント開発ツールの登場
  10. AI Agentの活用が広がり始めている 2025: The State of Generative AI in the

    Enterprise ワークフロー型が多数だが、エージェント型のユースケースが増えている エンタープライズ企業とスタートアップのワークフロー型・エージェント型 ユースケース比較(2025年版)
  11. LLMシステムの信頼性の担保が差別化要因 What 1,200 Production Deployments Reveal About LLMOps in 2025

    『What 1,200 Production Deployments Reveal About LLMOps in 2025』 によると ・2025年に最も成熟した領域は、LLMシステムの本番運用における評価システムと ガードレールの進化 ・2025年に信頼性の高いLLMシステムを構築している組織は、LLMを検証し、制限 すべきカオスな構成要素として扱っている 評価の重要性が高まっている
  12. 監視 コンテクスト エンジニアリング 評価 ツール管理 監視 フェイルオーバー 入力 ガードレール 出力

    ガードレール ワークフロー・エージェント オーケストレーション