LLMエージェント

LLMエージェント LLMエージェント LLMエージェント

LLMエージェント目次 • 何故AIエージェント？ • LLMエージェントとは何か？ • ワークフロー VS エージェント
• LLMエージェント開発における構成要素

LLMエージェント何故AIエージェント？

LLMエージェント 2025年はAIエージェント元年?

LLMエージェント AIエージェントの例・Cline:AIコーディングアシスタント・DeepResearch:情報を統合して詳細なレポートを作成・Operator:ブラウザを操作してタスクを自動的に実行・Manus:完全自律型の汎用AIエージェント・Genspark Super Agent:さまざまなツールを自動的に使用する“オールインワンのスーパーエージェント”

LLMエージェント LLMエージェントとは何か？

LLMエージェント LLMエージェント・LLMを活用したAIエージェント・2025年4月時点では、 AIエージェントは主にLLMエージェントを指すため、本発表ではAIエージェント=LLMエージェント

LLMエージェント LLMエージェントの定義？・「エージェント」という単語が一人歩きしている印象がある・文脈ごとに何を指しているか不明瞭のため、ある程度の共通認識がほしい

LLMエージェント LLMエージェントの定義？ • OpenAI • 「RAG・AIエージェント［実践］入門」 • 「やさしく学ぶLLMエージェント」

LLMエージェント OpenAI 私たちは「エージェント」をユーザーの代わりにタスクを自律的に実行するシステムであると捉えています。エージェント開発のための新たなツール(https://openai.com/ja-JP/index/new-tools-for-building-agents/)

LLMエージェント「RAG・AIエージェント［実践］入門」 AIエージェントとは、複雑な目標を自律的に遂行できる AIシステムを指します。（中略）与えられた目標を達成するために必要な行動を自ら決定し、実行することができます。

LLMエージェントやさしく学ぶLLMエージェント LLMエージェントとは、言語を用いて環境とインタラクションし、自律的に目的を達成するシステムである。

LLMエージェント「自律的」がキーワード

LLMエージェント「自律的」「自律的（じりつてき）」とは、自分自身で判断し、行動する能力があることを意味します。 by ChatGPT(gpt-4o)

LLMエージェント「自律的」「自律的」（じりつてき）は、外部からの指示や強制なしに、自分自身で考え、判断し、行動する能力や状態を意味します。 by Claude(3.7 Sonnet)

LLMエージェント「自律的」「自律的（じりつてき）」とは、他からの指示や支配を受けずに、自分自身の判断や意思に基づいて行動するという意味です。 by Gemini(2.0 Flash)

LLMエージェント冒頭に挙げた代表例は自律的 • ユーザーの入力に対して具体的な計画を立てる • 出力に対して次の行動を自分で決定する

LLMエージェントワークフロー VS エージェント

LLMエージェント Agentic Workﬂow(フローエンジニアリング) あるタスクを1つのLLMですべて解かせるのではなく、そのタスクを細分化して、LLMやアプリケーションの実装を組み合わせてどう解いていくかをデザインすることを指します。

LLMエージェント Agentic Workﬂow 自律的とは「自分がとるべき行動を自分で決める」ということだから、ワークフローを人間が決めている時点でエージェントとは呼ばないのでは？

LLMエージェント Agentic Workﬂow • ユーザー目線から見て「自律的」であればエージェントと呼んでしまおう • 「完全自律型」だと困ることもある ◦ 安定性がない
◦ 部分的に人間に置き換えることが難しい

LLMエージェント Building eﬀective agents Anthropic社が2024年12月に発表

LLMエージェント Building eﬀective agents 「エージェント」にはいくつかの定義がある。ある顧客は、エージェントを、複雑なタスクを達成するために様々なツールを使用し、長期間にわたって独立して動作する完全に自律的なシステムと定義している。また、事前に定義されたワークフローに従う、より規定的な実装を表すためにこの用語を使用する人もいます。
Anthropicでは、これら全てのバリエーションをエージェントシステムとして分類していますが、ワークフローとエージェントをアーキテクチャ上区別しています。

LLMエージェント Building eﬀective agents ワークフロー：LLMとツールが事前に定義されたコードパスを通してオーケストレーションされるシステムエージェント：LLMが自分自身のプロセスやツールの使い方を動的に指示し、タスクの達成方法をコントロールするシステム

LLMエージェント Building eﬀective agents 1. Building block: The augmented LLM(拡張LLM)
2.Workflow: Prompt chaining(ワークフロー: プロンプトチェーン) … 7.Agents(エージェント)

LLMエージェント Building eﬀective agents エージェントを実装する際、私たちは次の 3 つの基本原則に従うようにしています。 1.エージェントの設計ではシンプルさを維持します。 2.エージェントの計画手順を明示的に表示することで透明性を優先します。
3.徹底したツールのドキュメント化とテストを通じて、エージェントコンピュータインターフェイス (ACI) を慎重に作成します。

LLMエージェント LLMエージェント開発における構成要素

LLMエージェント主要構成要素 • Profile • Memory • Planning • Reflection
• Tool Use ◦ Retrieval(検索) ◦ MCP(Model Context Protocol) A Survey on Large Language Model based Autonomous Agents(2024) より引用

LLMエージェント Proﬁle エージェントに一貫した役割や人格を与える設定年齢・性格・知識領域などの情報をシステムプロンプトに組み込み、応答のスタイルや振る舞いを決定する

LLMエージェント Memory • エージェントが過去の対話や知識を保持・活用するための機構 • 短期メモリ：現在の状況に関するコンテキストを保持する一時的な記憶領域 • 長期メモリ：エージェントの過去の経験や知識を蓄積する
領域

LLMエージェント Planning • ユーザの質問や課題に答えるため解決策を立案するプロセス • 複雑な目標を達成するために必要な手順やサブタスクへ問題を分解し、順序立てて実行計画を作る

LLMエージェント Reﬂection • エージェントが自己の思考や行動を振り返り、誤りの修正や方針の改善を図る仕組み • 過去のアクションとその結果（観察）をもとにプランを見直し、間違いを訂正して最終結果の質を高める

LLMエージェント Tool Use • 検索エンジンやデータベース、計算器など外部ツールをLLMが呼び出して利用する能力 • これによりLLMは学習済みデータの範囲外のリアルタイム情報を取得したり、コード実行などのアクションを起こすことができる •
エージェントは必要に応じツールを使って情報収集や操作を行い、その結果（観察）に基づき内部状態や次の行動を調整しながらタスクを遂行する

LLMエージェント MCP(Model Context Protocol) • 2024年11月にAnthropic が発表したオープンプロトコル ◦ 生成AIモデルに文脈情報を渡しやすくするための技術規格 •
AI と外部システムの接続を標準化する • 「提供の仕方」と「呼び出し方」が共通化 • 「AI 用の USB-C ポート」(by Anthropic) • Claude以外でも利用が一気に進んでおり、エージェント問わず LLM関連で外部ソース・ツールアクセス時のデファクトになりそう

LLMエージェント

LLMエージェント MCP(Model Context Protocol)

LLMエージェント MCP(Model Context Protocol) • MCP ホスト: Claude Desktop、IDE、または MCP
を介してデータにアクセスする AI ツールなどのプログラム • MCP クライアント: サーバーとの 1:1 接続を維持するプロトコルクライアント • MCP サーバー: 標準化されたモデルコンテキストプロトコルを通じて特定の機能を公開する軽量プログラム • ローカルデータソース: MCP サーバーが安全にアクセスできるコンピューターのファイル、データベース、サービス • リモートサービス: MCP サーバーが接続できるインターネット経由 (API 経由など) で利用可能な外部システム

LLMエージェント LLMアプリケーション運用における重要要素・Human in the Loop ・Trace ・Evaluation ・LLM-as-a-Judge ・GuardRails

LLMエージェント Human in the Loop ・エージェントの意思決定プロセスに人間が関与し、必要に応じて承認・修正を行う仕組み・モデルに任せるにはリスクのあるツール実行要求に対して人間の承認を求めるゲートを設ける・モデルの生成した回答を人間がレビューして訂正するなど、重要局面での人間チェック
により結果の安全性と正確性を保障する・具体例：ClineやGithubCopilotAgentでコマンド実行可否を聞いてくれる

LLMエージェント Trace • エージェントがタスクを解決する過程でどのようなステップ・ツール・プロンプト・レスポンスを経たのかを記録する仕組み • ユーザー入力や、エージェントが内部で生成したプロンプトの履歴どのツール（例: 計算、検索、データベース照会）がいつ・どの引数で呼ばれたか • 出力されたテキスト、構造化データ、それをエージェントがどう扱ったか
• デバッグ、チューニング、可視化で使用

LLMエージェント Evaluation • エージェントの回答品質や動作を測定・検証する • 実際に得られた結果にハルシネーションが起きていたり、事実と違う結果になっていないかを確認する • 人間アノテータ(人間の目で確認・評価する役割)によるレビューの組み合わせや LLMによる主観評価（LLM-as-a-Judge）

LLMエージェント LLM-as-a-Judge ・ LLMを評価者として活用し、別のモデルやエージェントの出力を採点・判定する手法

LLMエージェント LangSmith • LangChain公式が提供するLLM（大規模言語モデル）アプリケーションの開発、テスト、デプロイ、監視を支援する統合プラットフォーム

LLMエージェント GuardRails ・出力内容の安全性と方針遵守を強制するためにエージェントに設けるルールやフィルタリング機構・ユーザーとLLMの間にルールベースの制御層を挟み、入力の検証・不適切なリクエストの遮断や、モデル出力の内容チェック（機密情報の漏洩防止・有害表現のフィルタ等）を行う

LLMエージェントエージェント構築のフレームワーク・LangChain + LangGraph:LLMを活用したステートフルなマルチエージェントアプリケーションの構築を支援するフレームワーク・AWS Bedrock Agents:Amazon Bedrock
上で LLMエージェントを簡単に構築できるサービス・Response API + Agent SDK:AIエージェントの開発とワークフローの管理を効率化するための APIと SDK(by OpenAI) ・AI SDK:TypeScript向けのツールキット ReactやNext.jsといったフレームワークと連携して AIアプリケーションを構築・Mastra:TypeScriptベースのAIエージェントフレームワークで、ワークフローや RAGパイプラインの構築を支援

LLMエージェント参考資料本 • 「RAG・AIエージェント［実践］入門」 • 「やさしく学ぶLLMエージェント」ワークフローVSエージェント • Building
Effective AI Agents • エージェント開発のための新たなツール • 「完全自律型」AIエージェント至高論への違和感〜ワークフロー構築という現実解 • AIエージェントについてまとめてみた

LLMエージェント参考資料エージェント構成要素・デザインパターン • 2025年の年始に読み直したいAIエージェントの設計原則とか実装パターン集 • AIエージェント入門 • LLM Agentの技術的な外観を理解する
• Building Effective AI Agents • エージェント開発のための新たなツール • AIエージェント時代の可能性と実践 • A survey on large language model based autonomous agents

LLMエージェント参考資料 MCP • Introduction - Model Context Protocol •
「MCP？聞いたことあるけど使ってない …😅」人向けに初歩から少し踏み込んだ内容まで解説 • やさしいMCP入門

LLMエージェント参考資料ニュース記事 • （記者解説）ＡＩエージェント、進む開発　人間に代わり「思考」し「行動」、現実味朝日新聞 (2025.01.13) • Nvidia CEO
Jensen Huang: What are AI agents that Nvidia CEO Jensen Huang says are a multitrillion-dollar opportunity? - The Economic Times(2025.01.13) • 2025 年 - エンタープライズ領域における AI エージェント元年に向けて(2025.01.07)

LLMエージェント

LLMエージェント

More Decks by philosophynote

Other Decks in Technology

Featured

Transcript