Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
【CA.ai #3】ワークフローから見直すAIエージェント — 必要な場面と“選ばない”判断
Search
SatoAoaka
November 28, 2025
Programming
0
320
【CA.ai #3】ワークフローから見直すAIエージェント — 必要な場面と“選ばない”判断
https://cyberagent.connpass.com/event/371245/
SatoAoaka
November 28, 2025
Tweet
Share
Other Decks in Programming
See All in Programming
Ruby x Terminal
a_matsuda
5
520
CSC307 Lecture 09
javiergs
PRO
1
850
LangChain4jとは一味違うLangChain4j-CDI
kazumura
1
120
要求定義・仕様記述・設計・検証の手引き - 理論から学ぶ明確で統一された成果物定義
orgachem
PRO
1
500
Rubyと楽しいをつくる / Creating joy with Ruby
chobishiba
0
200
Go1.26 go fixをプロダクトに適用して困ったこと
kurakura0916
0
310
オブザーバビリティ駆動開発って実際どうなの?
yohfee
3
630
今、アーキテクトとして 品質保証にどう関わるか
nealle
0
200
登壇資料を作る時に意識していること #登壇資料_findy
konifar
4
2k
Claude Codeと2つの巻き戻し戦略 / Two Rewind Strategies with Claude Code
fruitriin
0
200
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
130
AI巻き込み型コードレビューのススメ
nealle
2
2.4k
Featured
See All Featured
エンジニアに許された特別な時間の終わり
watany
106
240k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
260
Mobile First: as difficult as doing things right
swwweet
225
10k
A designer walks into a library…
pauljervisheath
210
24k
Paper Plane (Part 1)
katiecoart
PRO
0
5k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.1k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.2k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
280
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
190
For a Future-Friendly Web
brad_frost
183
10k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
170
Transcript
ワークフローから見直す AIエージェント — 必要な場面と“選ばない”判断 —
佐藤晴輝 • 所属 サイバーエージェント > AI 事業本部 • 業務内容 クリエイティブ生成AIプラットフォーム「AI
SCREAM」の バックエンドエンジニア @akp_working
1. エージェントを使って失敗した例 2. LLM/ワークフロー/エージェント 3. ワークフローの強みと弱み 4. エージェントの強みと弱み 5. まとめ
エージェントを使って 失敗した例
※これから紹介するサンプルはかなり抽象化してます 雰囲気で読み取ってください
ケーキ作成エージェント
オーブンツール • インプット 焼く内容の指定 • 副作用 焼いた結果が倉庫に保存される • レスポンス オーブンリザルトID
素材準備ツール • インプット 欲しい材料の指定 • 副作用 用意した材料が倉庫に保存される • レスポンス 材料IDのリスト
デコレーションツール • インプット ユーザーからのデザインの要望 素材のIDのリスト • 副作用 完成したケーキが倉庫に保存される※ • レスポンス
完成したケーキのID ※バーチャルケーキなので倉庫にある材料も無くならないとします
ケーキ作成エージェント • エージェントの目的 ユーザーの要望に従ってケーキを作成するエージェント • 提供されるツール 1. オーブンツール 2. 素材準備ツール
3. デコレーションツール それぞれのツールは完璧に仕事をこなし、在庫もなくならない夢のツールとします
(再掲)ケーキ作成エージェント いちごショー トが食べた い!
夢のようなツールを持ってしても 失敗した例をご紹介します
失敗ケース1 デコレーションする元がないためケーキが完成しない
失敗ケース2 ケーキは完成するが、今回用意したみかんと生クリームは使われない
失敗ケース3 ケーキは完成するがスポンジが一つ使われない
• ケース3:余計なステップの実行 エージェントが常に最短経路を選んでくれるとは限らない • ケース1:実行漏れ/順序崩れ ツールの実行順に前提条件があっても、それを守らせるのが難しい • ケース2:中間物の取り違え 今回のケーキ作成エージェントはツールの成果物をIDでしか認識していない。 「今回作った素材を使う」という判断を必ずさせるのは難しい
失敗ケースまとめ エージェントの判断次第で想定した動きをしてくれないことがある
エージェント辛い。。。 他に方法はなかったのかな?
LLM/ ワークフロー/ エージェント
エージェントとは? 定義が人によって様々 Anthropic は広義のエージェントという概念について ワークフローや(狭義 の)エージェントのようなアーキテクチャの区分があるとしています LLM/ワークフロー/エージェントという単語について 以下のページをもとに整理します https://www.anthropic.com/engineering/building-effective-agents
(拡張)LLM シンプルなモデルの呼び出しに加えて、検索やツールの実行などの拡張機能ま でを含めたもの 以降のワークフロー、エージェントが内部で利用するLLMはこれらの拡張機能が使える前提になります 引用:The augmented LLM
ワークフロー LLMとツールを「事前定義されたコードパス」で オーケストレーションするシステムのこと 実行フローは固定され、各ステップにゲートや検証を挿入できる 構成パターン例: プロンプトの連鎖/ルーティング/並列化 など
エージェント LLMが自らプロセスとツールの使用を「動的に指揮」するシステム • 計画→行動→観測を反復し、環境からの事実で進捗を評価 • チェックポイントや停止条件、HITL(人手インザループ)を組み込める • エージェントがワークフローを呼び出すことも可能 逆にワークフローが特定のステップでエージェントを呼ぶことも可能
ワークフローの強みと弱み
(再掲)ワークフロー LLMとツールを「事前定義されたコードパス」でオーケストレーションするシ ステムのこと 実行フローは固定され、各ステップにゲートや検証を挿入できる 構成パターン例: プロンプトの連鎖/ルーティング/並列化 など
ワークフローの強み • 決定的に実行できる • 条件分岐やエラーハンドリングも融通が効く • LLMの問題ではなくプログラムの問題にできる 引用:プロンプト連鎖ワークフロー 引用:ルーティングワークフロー
ワークフローを使った分岐 ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM
ワークフローの弱み • 未知のパターンへの弱さ • コンテキストの管理が難しい • 機能が増えてくると保守が困難
未知のパターンへの弱さ ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM チーズケーキを作っ て 作れないと回答するべき?近いやつで出すべき?
コンテキストの管理が難しい ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM このLLMの思考はコンテキストに残す? 残す場合はどこまで残す?
コンテキストの管理が難しい ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM このLLMの思考はコンテキストに残す? 残す場合はどこまで残す? ショートケーキ専門LLMのコンテキスト をチョコケーキ専門LLMに渡す?
機能が増えてくると保守が困難 ショートケーキ専門LLM チョコケーキ専門LLM ルーターLLM ・ ・ ・
エージェントの強みと弱み
(再掲)エージェント LLMが自らプロセスとツールの使用を「動的に指揮」するシステム • 計画→行動→観測を反復し、環境からの事実に基づいて進捗を評価 • チェックポイントや停止条件、HITL(人手インザループ)を組み込める • エージェントがワークフローを呼び出すことも可能 逆にワークフローが特定のステップでエージェントを呼ぶことも可能
エージェントの強み • 目的に対し計画→行動→観測を自律ループで遂行(途中で再計画が可能) 道のりが決まってない問題や未知のパターンへの適応力を持つ 引用:自律エージェント
自律ループ 終了条件を満たしていなければ追加の作業を実行できる イチゴが 足りな い!
自律ループ エラー内容を確認し、計画を修正できる エラー発 生! 再計画 キャンセ ル
未知パターンへの適応力 みかんケーキ を作って! りんごパイを 作って!
エージェントの弱み • ばらつき/非決定性が高く、SLAや再現性の確保が難しい 挙動が安定しない • 制御できる方法はあるが、実装難易度が高い チェックポイント/停止条件/ツール設計 など整備のコストが高い • LLMの思考が挟まるので時間と推論コストがかかる
• ケース3:余計なステップの実行 エージェントが常に最短経路を選んでくれるとは限らない • ケース1:実行漏れ/順序崩れ ツールの実行順に前提条件があっても、それを守らせるのが難しい • ケース2:中間物の取り違え 今回のケーキ作成エージェントはツールの成果物をIDでしか認識していない。 「今回作った素材を使う」という判断を必ずさせるのは難しい
(再掲)失敗ケースまとめ エージェントの判断次第で想定した動きをしてくれないことがある
まとめ
まとめ 1. 一種類のケーキのみ作れればOK -> LLM 2. いちごショートもみかんケーキも作りたい(焼く->素材作る->デコる) 単発LLMでは済まないが固定の手順 -> ワークフロー
3. りんごパイ(想定外のケーキ)も作りたい(焼く,素材作る,デコるが順不同) -> エージェント
結論 エージェントを使うのはどうしても必要な時だけにしよう
ありがとうございました