Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLMエージェント
Search
philosophynote
April 11, 2025
Technology
29
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LLMエージェント
個人で学習した内容を発表した際に資料したスライド
philosophynote
April 11, 2025
More Decks by philosophynote
See All by philosophynote
2025年における RubyでLLMを扱う選択肢
philosophynote
0
46
笑いながらバグを潰す方法
philosophynote
0
50
壁を乗り越えるためにGemを作成したら無知を知った話
philosophynote
0
150
技術力を捏造する
philosophynote
0
250
Other Decks in Technology
See All in Technology
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
160
フルAIで個人開発して学んだあれこれ / yuruai vol.1
isaoshimizu
0
110
SteampipeとExcel Power QueryでAWS構成定義書の作成を自動化する
jhashimoto
0
180
IaC コードを資産へ:AWS CDK 社内ライブラリと横断展開 / aws-summit-japan-2026
gotok365
10
1.6k
技術・能力を向上する原理原則 #きのこセッションa #きのこ2026
bash0c7
0
120
[AWS Summit Japan 2026]迷っているあなたへ_小さな一歩が、やがて自分を助けてくれる
sh_fk2
2
410
FPC(フレキシブル)基板にZephyr実装してみた。
iotengineer22
0
170
コミュニティの有益性 ~JAWS Days 2026 での体験を通して~ / The Benefits of a Community ~Through My Experience at JAWS Days 2026~
seike460
PRO
0
270
【Snowflake Summit 2026 Recap!!】Snowflake Summit Deep Dive: Security & Governance
civitaspo
1
310
スタートアップにAmazon EKSは早すぎる? マルチプロダクト戦略を加速する Platform Engineeringの実践 / Is Amazon EKS Too Soon for Startups? Practical Platform Engineering to Accelerate a Multi-Product Strategy
elmodev09
1
1.8k
AIが自律的に回る開発ループを設計してチーム開発に組み込む
nekorush14
0
130
2026 AI Memory Architecture
nagatsu
0
170
Featured
See All Featured
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
780
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
150
Code Reviewing Like a Champion
maltzj
528
40k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
2k
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.3k
sira's awesome portfolio website redesign presentation
elsirapls
0
280
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
240
Designing for Timeless Needs
cassininazir
1
260
Transcript
LLMエージェント LLMエージェント LLMエージェント
LLMエージェント 目次 • 何故AIエージェント? • LLMエージェントとは何か? • ワークフロー VS エージェント
• LLMエージェント開発における構成要素
LLMエージェント 何故AIエージェント?
LLMエージェント 2025年はAIエージェント元年?
LLMエージェント AIエージェントの例 ・Cline:AIコーディングアシスタント ・DeepResearch:情報を統合して詳細なレポートを作成 ・Operator:ブラウザを操作してタスクを自動的に実行 ・Manus:完全自律型の汎用AIエージェント ・Genspark Super Agent:さまざまなツールを自動的に使用 する“オールインワンのスーパーエージェント”
LLMエージェント LLMエージェントとは何か?
LLMエージェント LLMエージェント ・LLMを活用したAIエージェント ・2025年4月時点では、 AIエージェントは主にLLMエージェントを指すため、本発 表ではAIエージェント=LLMエージェント
LLMエージェント LLMエージェントの定義? ・「エージェント」という単語が一人歩きしている印象があ る ・文脈ごとに何を指しているか不明瞭のため、ある程度 の共通認識がほしい
LLMエージェント LLMエージェントの定義? • OpenAI • 「RAG・AIエージェント[実践]入門」 • 「やさしく学ぶLLMエージェント」
LLMエージェント OpenAI 私たちは「エージェント」をユーザーの代わりに タスクを 自律的に実行するシステムであると捉えています。 エージェント開発のための新たなツール(https://openai.com/ja-JP/index/new-tools-for-building-agents/)
LLMエージェント 「RAG・AIエージェント[実践]入門」 AIエージェントとは、複雑な目標を自律的に遂行できる AIシステムを指します。(中略)与えられた 目標を達成するために必要な行動を自ら決定し、実行す ることができます。
LLMエージェント やさしく学ぶLLMエージェント LLMエージェントとは、言語を用いて環境とインタラクショ ンし、自律的に目的を達成するシステムである。
LLMエージェント 「自律的」がキーワード
LLMエージェント 「自律的」 「自律的(じりつてき)」とは、自分自身で判断し、行動す る能力があることを意味します。 by ChatGPT(gpt-4o)
LLMエージェント 「自律的」 「自律的」(じりつてき)は、外部からの指示や強制なし に、自分自身で考え、判断し、行動する能力や状態を意 味します。 by Claude(3.7 Sonnet)
LLMエージェント 「自律的」 「自律的(じりつてき)」とは、他からの指示や支配を受け ずに、自分自身の判断や意思に基づいて行動するとい う意味です。 by Gemini(2.0 Flash)
LLMエージェント 冒頭に挙げた代表例は自律的 • ユーザーの入力に対して具体的な計画を立てる • 出力に対して次の行動を自分で決定する
LLMエージェント ワークフロー VS エージェント
LLMエージェント Agentic Workflow(フローエンジニアリング) あるタスクを1つのLLMですべて解かせるのではなく、そ のタスクを細分化して、LLMやアプリケーションの実装を 組み合わせてどう解いていくかをデザインすることを指し ます。
LLMエージェント Agentic Workflow 自律的とは「自分がとるべき行動を自分で決める」という ことだから、ワークフローを人間が決めている時点で エージェントとは呼ばないのでは?
LLMエージェント Agentic Workflow • ユーザー目線から見て「自律的」であれば エージェントと呼んでしまおう • 「完全自律型」だと困ることもある ◦ 安定性がない
◦ 部分的に人間に置き換えることが難しい
LLMエージェント Building effective agents Anthropic社が2024年12月に発表
LLMエージェント Building effective agents 「エージェント」にはいくつかの定義がある。ある顧客は、エージェ ントを、複雑なタスクを達成するために様々なツールを使用し、長 期間にわたって独立して動作する完全に自律的なシステムと定義 している。 また、事前に定義されたワークフローに従う、より規定的な実装を 表すためにこの用語を使用する人もいます。
Anthropicでは、これら全てのバリエーションをエージェントシステ ムとして分類していますが、ワークフローとエージェントをアーキテ クチャ上区別しています。
LLMエージェント Building effective agents ワークフロー:LLMとツールが事前に定義されたコードパ スを通してオーケストレーションされるシステム エージェント:LLMが自分自身のプロセスやツールの使 い方を動的に指示し、タスクの達成方法をコントロール するシステム
LLMエージェント Building effective agents 1. Building block: The augmented LLM(拡張LLM)
2.Workflow: Prompt chaining(ワークフロー: プロンプトチェーン) … 7.Agents(エージェント)
LLMエージェント Building effective agents エージェントを実装する際、私たちは次の 3 つの基本原則に従うようにしていま す。 1.エージェントの設計ではシンプルさを維持します。 2.エージェントの計画手順を明示的に表示することで透明性を優先します。
3.徹底したツールのドキュメント化とテストを通じて、エージェント コンピュータ インターフェイス (ACI) を慎重に作成します。
LLMエージェント LLMエージェント開発における構成要素
LLMエージェント 主要構成要素 • Profile • Memory • Planning • Reflection
• Tool Use ◦ Retrieval(検索) ◦ MCP(Model Context Protocol) A Survey on Large Language Model based Autonomous Agents(2024) より引用
LLMエージェント Profile エージェントに一貫した役割や人格を与える設定 年齢・性格・知識領域などの情報を システムプロンプトに組み込み、 応答のスタイルや振る舞いを決定する
LLMエージェント Memory • エージェントが過去の対話や知識を保持・活用するため の機構 • 短期メモリ:現在の状況に関するコンテキストを保持する 一時的な記憶領域 • 長期メモリ:エージェントの過去の経験や知識を蓄積する
領域
LLMエージェント Planning • ユーザの質問や課題に答えるため解決策を立案するプロセス • 複雑な目標を達成するために必要な手順やサブタスクへ問題 を分解し、順序立てて実行計画を作る
LLMエージェント Reflection • エージェントが自己の思考や行動を振り返り、誤りの修正や方 針の改善を図る仕組み • 過去のアクションとその結果(観察)をもとにプランを見直し、 間違いを訂正して最終結果の質を高める
LLMエージェント Tool Use • 検索エンジンやデータベース、計算器など外部ツールをLLMが呼び出して利用す る能力 • これによりLLMは学習済みデータの範囲外のリアルタイム情報を取得したり、コー ド実行などのアクションを起こすことができる •
エージェントは必要に応じツールを使って情報収集や操作を行い、その結果(観察) に基づき内部状態や次の行動を調整しながらタスクを遂行する
LLMエージェント MCP(Model Context Protocol) • 2024年11月にAnthropic が発表したオープンプロトコル ◦ 生成AIモデルに文脈情報を渡しやすくするための技術規格 •
AI と外部システムの接続を標準化する • 「提供の仕方」と「呼び出し方」が共通化 • 「AI 用の USB-C ポート」(by Anthropic) • Claude以外でも利用が一気に進んでおり、エージェント問わず LLM関連で外部ソース・ツールアクセス時のデファクトになりそう
LLMエージェント
LLMエージェント MCP(Model Context Protocol)
LLMエージェント MCP(Model Context Protocol) • MCP ホスト: Claude Desktop、IDE、または MCP
を介してデータにアクセスする AI ツールなどのプログラム • MCP クライアント: サーバーとの 1:1 接続を維持するプロトコル クライアント • MCP サーバー: 標準化されたモデル コンテキスト プロトコルを通じて特定の機能 を公開する軽量プログラム • ローカル データ ソース: MCP サーバーが安全にアクセスできるコンピューターの ファイル、データベース、サービス • リモートサービス: MCP サーバーが接続できるインターネット経由 (API 経由など) で利用可能な外部システム
LLMエージェント LLMアプリケーション運用における重要要素 ・Human in the Loop ・Trace ・Evaluation ・LLM-as-a-Judge ・GuardRails
LLMエージェント Human in the Loop ・エージェントの意思決定プロセスに人間が関与し、必要に応じて承認・修正を行う仕組 み ・モデルに任せるにはリスクのあるツール実行要求に対して人間の承認を求めるゲート を設ける ・モデルの生成した回答を人間がレビューして訂正するなど、重要局面での人間チェック
により結果の安全性と正確性を保障する ・具体例:ClineやGithubCopilotAgentでコマンド実行可否を聞いてくれる
LLMエージェント Trace • エージェントがタスクを解決する過程でどのようなステップ・ツール・プロンプト・レス ポンスを経たのかを記録する仕組み • ユーザー入力や、エージェントが内部で生成したプロンプトの履歴どのツール(例: 計算、検索、データベース照会)がいつ・どの引数で呼ばれたか • 出力されたテキスト、構造化データ、それをエージェントがどう扱ったか
• デバッグ、チューニング、可視化で使用
LLMエージェント Evaluation • エージェントの回答品質や動作を測定・検証する • 実際に得られた結果にハルシネーションが起きていたり、事実と違う結果になって いないかを確認する • 人間アノテータ(人間の目で確認・評価する役割)によるレビューの組み合わせや LLMによる主観評価(LLM-as-a-Judge)
LLMエージェント LLM-as-a-Judge ・ LLMを評価者として活用し、別のモデルやエージェントの出力を採点・判定する手法
LLMエージェント LangSmith • LangChain公式が提供するLLM(大規模言語モデル)アプリ ケーションの開発、テスト、デプロイ、監視を支援する統合プ ラットフォーム
LLMエージェント GuardRails ・ 出力内容の安全性と方針遵守を強制するためにエージェントに設けるルールやフィル タリング機構 ・ユーザーとLLMの間にルールベースの制御層を挟み、入力の検証・不適切なリクエス トの遮断や、モデル出力の内容チェック(機密情報の漏洩防止・有害表現のフィルタ等) を行う
LLMエージェント エージェント構築のフレームワーク ・LangChain + LangGraph:LLMを活用したステートフルなマルチエージェントアプリケーションの構築を 支援するフレームワーク ・AWS Bedrock Agents:Amazon Bedrock
上で LLMエージェントを簡単に構築できるサービス ・Response API + Agent SDK:AIエージェントの開発とワークフローの管理を効率化するための APIと SDK(by OpenAI) ・AI SDK:TypeScript向けのツールキット ReactやNext.jsといったフレームワークと連携して AIアプリケー ションを構築 ・Mastra:TypeScriptベースのAIエージェントフレームワークで、ワークフローや RAGパイプラインの構築 を支援
LLMエージェント 参考資料 本 • 「RAG・AIエージェント[実践]入門」 • 「やさしく学ぶLLMエージェント」 ワークフローVSエージェント • Building
Effective AI Agents • エージェント開発のための新たなツール • 「完全自律型」AIエージェント至高論への違和感〜ワークフロー構築という現実解 • AIエージェントについてまとめてみた
LLMエージェント 参考資料 エージェント構成要素・デザインパターン • 2025年の年始に読み直したいAIエージェントの設計原則とか実装パターン集 • AIエージェント入門 • LLM Agentの技術的な外観を理解する
• Building Effective AI Agents • エージェント開発のための新たなツール • AIエージェント時代の可能性と実践 • A survey on large language model based autonomous agents
LLMエージェント 参考資料 MCP • Introduction - Model Context Protocol •
「MCP?聞いたことあるけど使ってない …😅」人向けに初歩から少し踏み込んだ内容まで解説 • やさしいMCP入門
LLMエージェント 参考資料 ニュース記事 • (記者解説)AIエージェント、進む開発 人間に代わり「思考」し「行動」、現実味 朝日新聞 (2025.01.13) • Nvidia CEO
Jensen Huang: What are AI agents that Nvidia CEO Jensen Huang says are a multitrillion-dollar opportunity? - The Economic Times(2025.01.13) • 2025 年 - エンタープライズ領域における AI エージェント元年に向けて(2025.01.07)