Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Kubernetes上でAgentを動かすための最新動向と押さえるべき概念まとめ

 Kubernetes上でAgentを動かすための最新動向と押さえるべき概念まとめ

Avatar for Sota Makino

Sota Makino

April 09, 2026

Other Decks in Programming

Transcript

  1. Agentの定義から調べてみた 「エージェント」の定義は多岐にわたるが、Anthropicはこれらを広く エージェン ティックシステム(agentic systems)と捉えたうえで、LLMの自律性と制御の方法に もとづき、アーキテクチャを workflow と agent の2つに大別している。

    概要・特徴 LLM・ツールの制御 ① ワークフロー(Workflows) 事前に定義された手順に従って 動くシステム 人間(コード)が主導あらかじめ決まった経路 (コードパス)で連携・実行される。 ② エージェント(Agents) 自律的にプロセスを決定・実行 するシステム LLM自身が主導動的にタスクの達成方法やツー ルの使用を判断・指示する。 https://www.anthropic.com/engineering/building-effective-agents
  2. Agentの定義から調べてみた 「エージェント」の定義は多岐にわたるが、Anthropicはこれらを広く エージェン ティックシステム(agentic systems)と捉えたうえで、LLMの自律性と制御の方法に もとづき、アーキテクチャを workflow と agent の2つに大別している。

    概要・特徴 LLM・ツールの制御 ① ワークフロー(Workflows) 事前に定義された手順に従って 動くシステム 人間(コード)が主導あらかじめ決まった経路 (コードパス)で連携・実行される。 ② エージェント(Agents) 自律的にプロセスを決定・実行 するシステム LLM自身が主導動的にタスクの達成方法やツー ルの使用を判断・指示する。 https://www.anthropic.com/engineering/building-effective-agents
  3. タスク入力 質問:エッフェル塔が建築されて から何年経ちましたか? AI/ML Agent(思考1) 何をする必要がある? 質問に答えるためにエッフェル塔がいつ建 築されたか知る必要があります。 行動: web_search(‘エッフェル塔

    竣工’) 観察(Step1完了) 検索結果: 1889年 竣工 AI/ML Agent(思考2) 何をする必要がある? 竣工された年は今分かったので、2026か らその年数を差し引く必要がある 行動: calculate(2026 - 1889) 観察(Step2完了) 計算結果結果: 137 AI/ML Agent(思考3) 答えを得た エッフェル塔は建築されてから2026年時 点で137年経っていることが分かった 最終的な答え(成功): エッフェル塔は2026年で建築から137年経ちました
  4. タスク入力 質問:エッフェル塔が建築されて から何年経ちましたか? AI/ML Agent(思考1) 何をする必要がある? 質問に答えるためにエッフェル塔がいつ建 築されたか知る必要があります。 行動: web_search(‘エッフェル塔

    竣工’) 観察(Step1完了) 検索結果: 1889年 竣工 AI/ML Agent(思考2) 何をする必要がある? 竣工された年は今分かったので、2026か らその年数を差し引く必要がある 行動: calculate(2026 - 1889) 観察(Step2完了) 計算結果結果: 137 AI/ML Agent(思考3) 答えを得た エッフェル塔は建築されてから2026年時 点で137年経っていることが分かった 最終的な答え(成功): エッフェル塔は2026年で建築から137年経ちました 行動: web_search(‘エッフェル塔 竣工’) AI/ML Agent(思考1) 何をする必要がある? 質問に答えるためにエッフェル塔がいつ建 築されたか知る必要があります。 観察(Step1完了) 検索結果: 1889年 竣工 ReAct…推論と行動を組み合わせた手法
  5. タスク入力 質問:エッフェル塔が建築されて から何年経ちましたか? AI/ML Agent(思考1) 何をする必要がある? 質問に答えるためにエッフェル塔がいつ建 築されたか知る必要があります。 行動: web_search(‘エッフェル塔

    竣工’) 観察(Step1完了) 検索結果: 1889年 竣工 AI/ML Agent(思考2) 何をする必要がある? 竣工された年は今分かったので、2026か らその年数を差し引く必要がある 行動: calculate(2026 - 1889) 観察(Step2完了) 計算結果結果: 137 AI/ML Agent(思考3) 答えを得た エッフェル塔は建築されてから2026年時 点で137年経っていることが分かった 最終的な答え(成功): エッフェル塔は2026年で建築から137年経ちました 行動: web_search(‘エッフェル塔 竣工’) 行動: calculate(2026 - 1889) ツール…AI Agentが外部のツールや API とやり取り するためのもの。任意のコードも実行する
  6. タスク入力 質問:エッフェル塔が建築されて から何年経ちましたか? AI/ML Agent(思考1) 何をする必要がある? 質問に答えるためにエッフェル塔がいつ建 築されたか知る必要があります。 行動: web_search(‘エッフェル塔

    竣工’) 観察(Step1完了) 検索結果: 1889年 竣工 AI/ML Agent(思考2) 何をする必要がある? 竣工された年は今分かったので、2026か らその年数を差し引く必要がある 行動: calculate(2026 - 1889) 観察(Step2完了) 計算結果結果: 137 AI/ML Agent(思考3) 答えを得た エッフェル塔は建築されてから2026年時 点で137年経っていることが分かった 最終的な答え(成功): エッフェル塔は2026年で建築から137年経ちました タスク入力 質問:エッフェル塔が建築されて から何年経ちましたか? 最終的な答え(成功): エッフェル塔は2026年で建築から137年経ちました セッション…Agentが一度起動してから、いったん区切られる までの1回の実行単位 セッションまたぎ…前回の文脈を外部状態に落として、次回そ れを読んで再構築すること Anthropicは、次のセッションのために claude-progress.txt, feature list, git history のような artifacts を残す設計を取っています。これで「何をやったか」「今 どこまで進んでいるか」「次に何をやるか」をセッション外に保存します。
  7. タスク入力 質問:エッフェル塔が建築されて から何年経ちましたか? AI/ML Agent(思考1) 何をする必要がある? 質問に答えるためにエッフェル塔がいつ建 築されたか知る必要があります。 行動: web_search(‘エッフェル塔

    竣工’) 観察(Step1完了) 検索結果: 1889年 竣工 AI/ML Agent(思考2) 何をする必要がある? 竣工された年は今分かったので、2026か らその年数を差し引く必要がある 行動: calculate(2026 - 1889) 観察(Step2完了) 計算結果結果: 137 AI/ML Agent(思考3) 答えを得た エッフェル塔は建築されてから2026年時 点で137年経っていることが分かった 最終的な答え(成功): エッフェル塔は2026年で建築から137年経ちました 最終的な答え(成功): エッフェル塔は2026年で建築から137年経ちました Agentは、単発のLLM呼び出しではなく、 ツールを使いながら複数ステップ・複数セッションにまたがって動く。
  8. では、Agentのランタイムには何が必要か? • 永続性 — ファイルや進捗を保持できること • 継続性 — 複数セッションをまたいで作業を続けられること •

    分離性 — 実行環境を安全に隔離し、影響範囲を限定できること • 再開性 — 中断後も途中状態から再開できること • 観測性 — 実行内容や判断過程を追跡できること
  9. 標準のKubernetesリソースで足りるのか? リソース 向いていること ギャップ Deployment stateless な常駐サービス 状態保持やセッション継続が弱い Job 単発処理と再試行

    再開ではなく再実行 StatefulSet stable identity と永続ストレージ 文脈復元や進捗管理は別途必要 Deployment / Job / StatefulSet は、それぞれ一部の性質は満たせるが、 Agentにコード実行や外部ツール利用を許すなら、安全に閉じ込める分離性が別途必要
  10. Agent Sandbox • これは何 ◦ 通常の Deployment や Job では扱いにくい、長時間・状態保持型のワークロードを

    Kubernetes 上で扱うための OSS ◦ AI agent runtimes も代表的なユースケースに含まれる • コア機能 ◦ Sandbox CRD によって、安定した実行先、永続ストレージ、停止・再開を含むライフサイク ル管理を提供する • 拡張機能 ◦ SandboxTemplate / SandboxClaim / SandboxWarmPool により、定義の再利用、利用の簡 略化、起動時間の短縮を実現します。
  11. • AI Agent のコード実行環境 LLM が生成したコードや、信頼できないコードを 隔離された環境で安全に実行する用途。公式 overview でも、 AI

    agent runtimes は代表的ユースケースとして挙げられている • コーディング Agent の実行基盤 公式 examples には “Coding Agent on Agent-Sandbox and LangGraph” があり、コーディング Agent を Kubernetes 上で動かす例が用意されている • computer use / browser 操作 Agent runtime templates には “Python Runtime Sandbox for Gemini Computer Use Agent” があり、ブラウザ操作 を伴う Agent の実行基盤として使える • JupyterLab や単一ユーザー向け開発環境 examples には JupyterLab や Isolated ML Workspaces もあり、Agent 以外にも 長時間・状態保持・単一実体 の作業環境に使える • 小さな stateful single-pod service overview では、build agent や small database のような 単一インスタンスで安定したIDが必要なサービス も対象 に挙げている Agent Sandbox の具体的なユースケース
  12. まとめ • AI Agent のランタイムには、永続性・継続性・分離性・再開性・観測性が求めら れる。 • 標準の Kubernetes リソース(Deployment

    / Job / StatefulSet)だけでは、これ らを統合的に満たすのは難しい。 • Agent Sandbox(SIG Apps 配下の OSS)は、stable identity / persistent storage / pause・resume などを Sandbox CRD としてまとめて提供し、この ギャップを埋める。 • コード実行 Agent、browser-use Agent、JupyterLab など、長時間・状態保持型 ワークロードの実行基盤として活用できる。