Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Algothythm behind Gemini Enterprise Agent Desig...

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

Algothythm behind Gemini Enterprise Agent Designer (with least amount of inputs from human)

次の文献を対象にサーベイしたスライドを、技術的な検証のため Gemini CLI (Gemini 3.1) で作成したものです。作成時にはサーベイの結果に関連した情報は一切与えず、ツールの使い方の指示を与えるとともに、評価・評価基準の改善・アウトプットの改善を繰り返すよう指示することだけ行いました。

- Context Engineering 2.0: [2510.26493] Context Engineering 2.0: The Context of Context Engineering
- MLE-STAR: [2506.15692] MLE-STAR: Machine Learning Engineering Agent via Search and Targeted Refinement
- DS-STAR: [2509.21825] DS-STAR: Data Science Agent via Iterative Planning and Verification
- PlanGen: [2411.02275] PlanGen: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories
- MASS: [2502.02533] Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies
- H-Swarm: [2502.13840] Heterogeneous Swarms: Jointly Optimizing Model Roles and Weights
- Scaling Agent Systems: [2501.12948] Towards a Science of Scaling Agent Systems
- MCP: Model Context Protocol Specification (Anthropic / community-led)
- Skills: Agent Skills Standard (https://agentskills.io/)
- A2A: Agent-to-Agent Protocol (https://a2a-protocol.org/)

Avatar for Asei Sugiyama

Asei Sugiyama

February 22, 2026
Tweet

More Decks by Asei Sugiyama

Other Decks in Technology

Transcript

  1. Context Engineering 2.0: エン トロピー削減 対象: 長期タスクにおける人間と機械のイン タラクション。 前提: コンテキスト長には限界があり、情報

    圧縮が求められる。 必要性: 機械は暗黙の文脈を補完できないた め、システム側で対応。 結論: 単純なコンテキスト拡張はAttentionの 精度劣化を招く。 対策: 抽象化やサブエージェントによるコン テキスト隔離が不可欠。 Algothythm behind Gemini Enterprise Agent Designer Context Engineering 2.0: The Context of Context Engineering (Hua et al., 2025) 4
  2. DS-STAR: データサイエン スにおける反復的計画 対象: 異種フォーマットを含む複数デ ータソースの分析。 前提: 正解ラベルがなく、実行結果の みで計画を評価できない。 手法:

    Verifierが結果の「十分性」を判 定しフィードバック。 結論: 実行成功をゴールとする既存手 法より精度が高い。 課題: トークン消費量が約3.5倍に増加 するトレードオフが存在。 Algothythm behind Gemini Enterprise Agent Designer DS-STAR: Data Science Agent via Iterative Planning and Verification (Nam et al., 2025) 6
  3. MLE-STAR: MLエンジニア リングの局所的洗練 対象: Kaggle等での機械学習パイプラ イン構築。 前提: LLMは学習データに依存し、古 い手法に偏る傾向がある。 手法:

    Web検索で最新モデルを収集 し、影響の大きい部分のみ改善。 結論: コード全体を再生成するよりエ ラー蓄積を防ぎ高精度。 課題: テストデータを前処理に使うデ ータリークのリスクが高い。 Algothythm behind Gemini Enterprise Agent Designer MLE-STAR: Machine Learning Engineering Agent via Search and Targeted Refinement (Nam et al., 2025) 7
  4. PlanGEN: 推論アルゴリズ ムの動的選択 対象: カレンダー調整や数理・金融推論 など、複雑な計画立案。 前提: タスクの難易度は異なり、単一 の推論手法では対応不可。 手法:

    制約を抽出し、問題の複雑度に 応じてアルゴリズムを動的選択。 結論: 探索戦略の切り替え(Mixture of Algorithms)は有効。 課題: アルゴリズム選択がプロンプト に強く依存し、汎化に難あり。 Algothythm behind Gemini Enterprise Agent Designer PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving (Parmar et al., 2025) 8
  5. 3. Automated Design & Scaling: MASの自動設計とスケーリン グ則 Algothythm behind Gemini

    Enterprise Agent Designer A Survey on Multi-Agent System Design and Automation 9
  6. MASS: プロンプトとトポ ロジーの段階的最適化 対象: 推論やコーディング等の一般的 なマルチエージェント協調。 前提: 性能はプロンプトの質と接続構 造(トポロジー)に極めて敏感。 手法:

    個々のプロンプトを最適化した 上で、最適なトポロジーを探索。 結論: 複雑なトポロジーよりも個々の プロンプト設計が性能に直結。 対策: 無駄なトポロジーは性能を下げ るため、探索空間の枝刈りが必須。 Algothythm behind Gemini Enterprise Agent Designer Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies (Zhou et al., 2026) 10
  7. Heterogeneous Swarms: ロールと重みの結合最適化 対象: エージェントによる協調生成 (Collaborative generation) 。 前提: 異なる専門性を持つ複数のLLM

    モデルが利用可能であること。 手法: 連続的な隣接行列で入出力DAG を最適化し、重みをPSOで更新。 結論: タスクにより「ロール」か「専 門知識(重み) 」の重要度が変化。 課題: 計算コストが高く、実運用には 通信のスパース化が不可欠。 Algothythm behind Gemini Enterprise Agent Designer HETEROGENEOUS SWARMS: Jointly Optimizing Model Roles and Weights for Multi-LLM Systems (Feng et al., 2025) 11
  8. Scaling Agent Systems (1/2): タスク依存性 対象: 環境との継続的なインタラクションを 伴うAgenticなタスク。 前提: タスクの依存関係(並列か直列か)が

    パフォーマンスに直結。 結論: 「エージェントを増やせば性能が上が る」という仮説は否定。 事例: 並列化可能な金融分析タスクでは Centralized構成が有効。 事例: 順序依存の強いタスクでは通信オーバ ーヘッドで性能が低下。 Algothythm behind Gemini Enterprise Agent Designer Towards a Science of Scaling Agent Systems (Kim et al., 2025) 12
  9. Scaling Agent Systems (2/2): スケーリングの限界 ツールの代償: ツール呼び出しが多い タスクは単一エージェントが有利。 能力の飽和: 基礎性能が約45%を超え

    るタスクはMASの限界効用が低下。 エラー増幅: 独立型MASではエラーが 17.2倍に増幅され大失敗を招く。 対策: オーケストレーターによる検証 とエラー抑制構造が必須。 結論: MASの有効性は「タスクの分割 可能性」に完全に依存する。 Algothythm behind Gemini Enterprise Agent Designer Towards a Science of Scaling Agent Systems (Kim et al., 2025) 13
  10. 4. Synthesis & Guidelines: 実践的な設計指針 Algothythm behind Gemini Enterprise Agent

    Designer A Survey on Multi-Agent System Design and Automation 14
  11. サーベイからの客観的結論と設計指針 1. トポロジーより個のプロンプトを優先せよ (MASS, PlanGEN) 複雑なグラフ構造を組む前に、個別のプロンプトを徹底的に最適化する。 2. タスクの分割可能性を見極めよ (Scaling Agent

    Systems) MAS化は「並列処理」が可能なタスクのみ適用。他は単一エージェントで。 3. 検証とエラー隔離の仕組みを組み込め (DS-STAR, MLE-STAR) 出力を盲信せず「十分性」を判定し、コンテキストの肥大化を防ぐ。 4. 動的ルーティングとスパース化 (H-Swarm, PlanGEN) 複雑さに応じて推論手法や通信パスを間引き、コストと精度を最適化。 Algothythm behind Gemini Enterprise Agent Designer A Survey on Multi-Agent System Design and Automation 15