Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIAgentの限界を超え、 現場を動かすWorkflowAgentの設計と実践

Avatar for Koji Miyata Koji Miyata
October 05, 2025

AIAgentの限界を超え、 現場を動かすWorkflowAgentの設計と実践

東京AI祭 2025で登壇させていただいた資料です。
AIAgentのPoCの壁を超えて、実際に業務で効果を出し、業務改善をする為の設計パターンと、
その中でのトレードオフと課題についてまとめています。

【イベントリンク】
https://www.aisai.tokyo/
https://ai-fest-tokyo.connpass.com/event/365303/

【イベント概要】
📌 概要
東京AI祭は日本最大級のAIテックカンファレンスです。専門家によるセッションやブース展示に加え、ハッカソン・生成AI作品コンテストなどの参加型企画を通じて、開発者・クリエイター・学生が最先端の知見とネットワークを深める場となります。

📆 開催日時
DAY1 :2025年10月4日(土) 12:00–18:00 (受付11:30〜)
DAY2 :2025年10月5日(日) 11:00–17:00 (受付10:30〜)

📍 開催場所
Abema Towers 10F・11F (J渋谷駅徒歩7分)

Avatar for Koji Miyata

Koji Miyata

October 05, 2025
Tweet

More Decks by Koji Miyata

Other Decks in Technology

Transcript

  1. © 2025 Algoage, Inc. Profile 2013〜 学生ベンチャー等でエンジニア活動  スマホアプリ •Web開発/VR•AR開発 2015〜

    コロプラ  VRゲーム/IPを使った位置ゲー /スマホゲーム開発 2020〜 DMM.com  2020〜   マーケティングテクノロジー横断部署 EM/TL  2023〜   株式会社DMMCrypto CTO   ブロックチェーン構築 /Crypto事業開発  2025〜   株式会社Algoage CTO   既存事業の運用体制改善 /新規事業の開発 /AIのR&D等 宮田航志 @miyata_17_ このXアカウントで 本日の資料を配布予定です 2
  2. © 2025 Algoage, Inc. R&D HISTORY これまでの R&D事例 創 業

    期 から、 私 たちは「 研 究 × 実 装 × 商 ⽤ 適 ⽤ 」を 強 みとして、AI 技 術 で ⼤ 企 業 の 難 題 を 解 決 してきました。 この課題解決⼒と数々の実績が、DMMグループへのスピーディーな参画を実現させ、現在の“事業創造”の礎となっています。 独自ディープラーニングエンジンの 構築(大手ガス会社向け) 遮蔽物下でも⼈物を追跡するために⾻格 推定モデルを改良。データ拡張や軽量化 を⾏い、リアルタイム処理を実現。 深層学習による画像再構成の研究 (不動産 VR向け) パノラマ特 有の幾 何 歪みやノイズを、 CNN+inpaintingで補正。VRサービス に耐えうる画質で商⽤レベルに適⽤。 画像解析とエンタメを接続する生成 モデル(アニメ業界向け) 1枚のイラストからキャラクターを動か すモデルを開発。少データ環境でも⾃然 なモーションを⽣成できるよう⼯夫。 4
  3. © 2025 Algoage, Inc. © 2025 Algoage, Inc. なぜ今Workflow Agent?背景と課題

    業務フローの形式化と評価 信頼性/安全性を担保する実行環境 事例と今後の話 設計原則と全体アーキテクチャ AGENDA 本日のアジェンダ 6
  4. © 2025 Algoage, Inc. 自律性に頼りすぎると、小手先のガードレール設計に追われる 再現性の壁:振る舞いが予測不能 同じ指示でも結果が安定しない LLMの内側で都度計画生成させると、外から固定・検証しずらい AIAgentの現場導入を阻む壁 コストの壁:複雑化すると遅くて高くなる

    複雑なタスクほどLLM呼び出しが雪だるま式に増え、待ち時間と費用が読めない 計画と実行が混線し、探索や再試行を外側で制御・キャッシュできない セキュリティ・ガバナンスの壁:運用コストと監査コスト 越権操作やPII露出の懸念で、運用・監査・本番導入が止まる 全体のリスクが掴めないと本番導入は進みずらい ⚠ ⚠ ⚠ 8
  5. © 2025 Algoage, Inc. PoC⇨現場導入のために、業務と環境を見極めて適切な設計選定が必要 ◾外部環境:実際の効果を出す為に  ・LLMの性能向上と共に自律的に任せれるスコープも増えているが、   PoCを超える為の信頼性の壁は高い  ・「顧客が求めていた物」は LLMのビックリ体験の時もあれば、

      普段の業務をミスせず任せられる小さな体験の時もある ◾開発側の観点:コストと実現性  ・”いかに作りこまないか ”が鉄則だが、シンプルなプロンプト /シングルエージェント   マル チエージェント・宣言方ワークフロー /暗黙的ワークフロー等々、日進月歩で   選択肢が変わっている  ・R&D開発コストと要求を踏まえてトレードオフを理解した設計と評価が必要 業務効率化に必要な観点 9
  6. © 2025 Algoage, Inc. 設計パターンマッピング どこまで”宣言”し、どこを “自律”にするか LLM の自 律性

    ワークフロー宣言/ルールの厳密さ 特徴:計画/実行をLLM中心に行う    柔軟性は高い /再現性+コストに難 用途:リサーチ/PoC 等 自律高 × 宣言低 特徴:外側でフローを宣言 ,内側の判断は      LLMで補助。再現性と適応性を両立    安全設計・評価を外付け可能 用途:本番運用の半自動化    採用・要件定義など 自律高 × 宣言高 特徴:単発プロンプト+軽いツール連結    状態を持たない。    立ち上げ最速・再現性低 用途:下書き/要約/軽い調査 自律低 × 宣言低 特徴:フローを厳密に宣言、 LLMは抽出    分類など点部品    決定論的で監査に強いが柔軟性は低い 用途:審査/与信/定型処理・締め作業 自律低 × 宣言高 11
  7. © 2025 Algoage, Inc. 設計パターンマッピング どこまで”宣言”し、どこを “自律”にするか LLM の自 律性

    ワークフロー宣言/ルールの厳密さ 特徴:計画/実行をLLM中心に行う    柔軟性は高い /再現性+コストに難 用途:リサーチ/PoC 等 自律高 × 宣言低 特徴:外側でフローを宣言 ,内側の判断は      LLMで補助。再現性と適応性を両立    安全設計・評価を外付け可能 用途:本番運用の半自動化    採用・要件定義など 自律高 × 宣言高 特徴:単発プロンプト+軽いツール連結    状態を持たない。    立ち上げ最速・再現性低 用途:下書き/要約/軽い調査 自律低 × 宣言低 特徴:フローを厳密に宣言、 LLMは抽出    分類など点部品    決定論的で監査に強いが柔軟性は低い 用途:審査/与信/定型処理・締め作業 自律低 × 宣言高 12 Agent開発 本 番 導 入
  8. © 2025 Algoage, Inc. 設計パターンマッピング どこまで”宣言”し、どこを “自律”にするか LLM の自 律性

    ワークフロー宣言/ルールの厳密さ 特徴:計画/実行をLLM中心に行う    柔軟性は高い /再現性+コストに難 用途:リサーチ/PoC 等 自律高 × 宣言低 特徴:外側でフローを宣言 ,内側の判断は      LLMで補助。再現性と適応性を両立    安全設計・評価を外付け可能 用途:本番運用の半自動化    採用・要件定義など 自律高 × 宣言高 軽量プロンプト連結 単発ツール 簡易オートメーション 小粒タスク/補助用途 自律低 × 宣言低 完全宣言 (DSL100%・テーブル駆動) 従来の仕組みに近い、今までの業務に一部 LLM ワークフローを入れる 自律低 × 宣言高 ⭐ 今日はこれを 深掘りします 13
  9. © 2025 Algoage, Inc. 4つの段階と評価サイクルで、マニュアルの形式知化から安全な実行までを実現する 全業務フロー作成 状態を ストリーム配信 Formalize Intent

    check Exec/Observe Control MCPツール PIIフィルタ    HaaT etc… Workflow Agent アーキテクチャ 意図解釈と ワークフロー選定 結果ログ 評価ログ 業務改善提案 実行 評価 LangGraph等 でフロー実行 エージェントに 指示 評価/改善 安全実行 14
  10. © 2025 Algoage, Inc. 4つの段階と評価サイクルで、マニュアルの形式知化から安全な実行までを実現する 全業務フロー作成 状態を ストリーム配信 Formalize Intent

    check Exec/Observe Control MCPツール PIIフィルタ    HaaT etc… Workflow Agent アーキテクチャ 意図解釈 ワークフロー選定 結果ログ 評価ログ 業務改善提案 実行 評価 LangGraph等 でフロー実行 エージェントに 指示 評価/改善 安全実行 16
  11. © 2025 Algoage, Inc. 構文的に正しくても、業務の意図に沿っているとは限らない Validation(構文妥当性) 1. ドメインに特化したDSL定義 2. 人間マニュアルから自動生

    3. 構文を検証するツールの開発 難所:DSL定義に業務理解が必須 Verification(意味的正しさ) 1. 評価指標の決定 2. 各種ログ分析による評価 3. 価値と網羅性の担保 難所:評価プロセスの構築 業務フロー構築の課題 17
  12. © 2025 Algoage, Inc. 曖昧な自然言語マニュアルを、 DSLに変換しワークフロー化 人間が書いたマニュアルをLLMが変換 Validation(構文妥当性) LLMによる 変換

    特定ルールによる 自己修正 これにより、構文的な正しさ (Validation) は自動的に担保される DSLのスキーマ辞書をツールとして渡し 文法エラーがなくなるまでLLMが自己修正を繰り返す 18
  13. © 2025 Algoage, Inc. 各業務フローに対するワークフローの網羅性担保と、評価改善 業務フローの深い理解 これまで以上に深く業務に入り込んで深く理解が必要 Verification(意味的正しさ /価値) 網羅性担保

    評価改善 プロセス これにより、ワークフローの網羅率が上がり、AIAgentに任せれる量が増え、 質の担保もされていく 実行環境のログとワークフロー成果物を照らして ワークフロー自体の価値を評価・改善が必須 19
  14. © 2025 Algoage, Inc. 4つの段階と評価サイクルで、マニュアルの形式知化から安全な実行までを実現する 全業務フロー作成 状態を ストリーム配信 Formalize Intent

    check Exec/Observe Control MCPツール PIIフィルタ    HaaT etc… Workflow Agent アーキテクチャ 意図解釈 ワークフロー選定 結果ログ 評価ログ 業務改善提案 実行 評価 LangGraph等 でフロー実行 エージェントに 指示 評価/改善 安全実行 21
  15. © 2025 Algoage, Inc. 実行すべきワークフローの選定 意図解釈に必要な情報を過去ログ含め検索 必要あれば依頼元に確認する。 実行時の為の コンテキスト 意図解釈の為の

    コンテキスト 実行側のエージェント設計に強く依存するが コンテキストエンジニアリングのチューニングの必要性がある 関連データから外部連携してデータを取得 必要あれば依頼元に確認する 出された指示がどのワークフローにあたるのかの選定 22
  16. © 2025 Algoage, Inc. 4つの段階と評価サイクルで、マニュアルの形式知化から安全な実行までを実現する 全業務フロー作成 状態を ストリーム配信 Formalize Intent

    check Exec/Observe Control PIIフィルタ MCPツール    HaaT etc… Workflow Agent アーキテクチャ 意図解釈 ワークフロー選定 結果ログ 評価ログ 業務改善提案 実行 評価 LangGraph等 でフロー実行 エージェントに 指示 評価/改善 安全実行 23
  17. © 2025 Algoage, Inc. 重要な判断や操作は、 AIが自律実行せず人間に「止めて、人に尋ねる」 ・ワークフローの途中で人間の判断が必要なステップで プロセスを一時停止 ・ユーザーに情報を提示し、入力を求める (例:承認、追加情報の提供

    ) ・人間の回答を受けて、ワークフローを 安全に再開 する ・AIと人間の自然な協調 を実現する中心的な仕組み、 DSLでも詳細に定義が必要 安全設計例 : Human-as-a-Tool (HaaT) 26
  18. © 2025 Algoage, Inc. 全てのツール実行を中央集権化し、最小権限の原則を徹底する ・権限分離 : 参照系(GET)は自動実行、更新系 (POST)は人間による承認 を必須とする等々

    ・Dry-run: 破壊的操作の前には必ず 差分を提示し、承認後にのみ実行する ・高コストが予想されるアクションに関する事前確認 安全設計例 : MCP呼び出しツールの権限制御 27
  19. © 2025 Algoage, Inc. 状況に応じて適切なワークフロー(子)を動的に生成・実行する 1 親Agent: 依頼内容を解釈 2 親Agent:

    最適なワークフローを選択 3 親Agent: 実行担当の子Agentを生成 4 子Agent: ワークフローをグラフ展開し、忠実に実行 応用例:親子エージェントによる動的な実行 実行段階の設計に関しても速度と信頼性において様々なトレードオフが存在する コンテキストエンジニアリング /エージェントの分割粒度 等々が設計の肝 29
  20. © 2025 Algoage, Inc. 本質的に価値がありインパクトが出せる事業の開発をしています AI R&Dエンジニア AIに関する様々なリサーチとPoC実装 データエンジニア 評価プロセスにおける分析・改善・実装

    フルスタックエンジニア ソフトウェア全般の開発と運用/スクラム運営 EM / PjM / PdM 新規事業のプロダクト開発におけるマネジメント We're Hiring! 30