Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI駆動のマルチエージェントによる業務フロー自動化の設計と実践

 AI駆動のマルチエージェントによる業務フロー自動化の設計と実践

Avatar for 岡本秀明

岡本秀明

July 04, 2025
Tweet

Other Decks in Programming

Transcript

  1. Algorithm + Vision = Algion 🧭 Vision(目的・Why) 人々の可能性を最大限に引き出す 🚀 Mission(手段・How)

    テクノロジーを価値に変え、人々の創造と成長を加速させる 会社名 Algion株式会社 代表者 代表取締役CEO 岡本 秀明 設立日 2025年6月10日 所在地 〒107-0062 東京都港区南青山3-1-36 青山丸竹ビル6F 事業内容 法人向けAIソリューション、AIコンサルティング、SaaSプロダクト 会社概要 2 データとアルゴリズムで人々のビジョンを実現する
  2. • 法政大学大学院で機械学習 /画像認識を研究、修士号を取得 ◦ 在学中にIEEE BigDataに論文を発表 • 2021年4月〜2023年10月 ソフトバンク株式会社 機械学習エンジニア

    ◦ 高市場価値AI人材に認定されリーダー /係長級に飛び級昇進 • 2023年11月〜 PayPay株式会社 Senior Software Engineer ◦ AIプロダクト、ローカル LLM/RAG、AIエージェントを開発 • 並行してAlmondoを含む複数のAIスタートアップで 機械学習エンジニア、ソフトウェアエンジニア、 PMとして活動 • 2025年6月〜 Algion株式会社 代表取締役CEO 自己紹介 3 岡本秀明 Hideaki Okamoto
  3. 1. AI活用の現在地と課題 ◦ なぜ今、AIエージェントに投資すべきなのか? ◦ AI活用の最新ラインナップ(モデル・ツール・開発) ◦ 段階的なAI活用と各フェーズに潜む課題 2. AIエージェントのデザインパターン

    ◦ 成果を最大化する5つの設計理論 3. Live Demo: LangGraphを活用したSWE-Agentの実装 ◦ 簡易ナレッジ検索AIの構築を通じて学ぶAIエージェント開発の基本 4. Algionが提供するAIエージェント導入ロードマップ ◦ ビジネス実装への具体的なステップと成功のポイント アジェンダ 4
  4. 1. 市場の常識へ:多くの企業が「導入前提」フェーズに突入 ◦ もはや導入検討ではなく、「いかに早く、効果的に導入するか」が焦点 ◦ PwCの調査によると、経営層の70%以上がAIエージェントを「ビジネスに不可欠な もの」と認識(PwC’s AI Agent Survey)

    2. ROIの証明:実験から「利益創出」のフェーズへ ◦ IBMの最新の調査では、導入企業は平均して15%のコスト削減 と12%の収益向 上を実現したと報告(IBM Study: Businesses View AI Agents) ◦ AIエージェントは、確実に利益を生み出すための戦略的投資である 3. 技術と市場の成熟:最大の成長カーブを描く絶好の機会 ◦ LangChain / AutoGen / CrewAI など多彩なフレームワークが実運用レベルに ◦ AIエージェントの市場規模は2032年に1000億ドルを超え、年平均45%で成長する と予測されている(AI Agent Statistics for 2025: Adoption) なぜ今、AIエージェントに投資すべきなのか? 6
  5. • OpenAI GPT-o3 「高速・低コストな推論 + 検索の標準機」 • OpenAI GPT-o3 Pro

    「精度優先、待ち時間と引き換えに信頼性を極める」 • OpenAI GPT-4.5 「表現力と創造性を備えた大型ジェネラティブ」 • Anthropic Claude 4 Opus 「コードと解析を請け負う職人肌エンジニア」 • Google Gemini 2.5 Pro 「マルチモーダル × Workspace の万能秘書」 万能モデルなし → 適材適所 × 設計力が勝負 AIモデルの進化と最新ラインナップ( 2025年7月時点) 7 時期 キーワード 例 2012 - 2017 ディープラーニング CNN / RNN, AlexNet, ResNet 2017 - 2020 Transformer Self-Attention, GPT, BERT 2020 - 2023 生成AI / 基盤モデル LLM, ChatGPT, Stable Diffusion 2023 - 現在 AIエージェント / 推論モデル ReAct, Tool Use, Multi-Agent
  6. AIツールタイプ別活用法 8 ノーコード拡張型 自律リサーチ型 ワークスペース統合型 外部情報や社内ストレージを 自律クロール → 要約/洞察 市場調査・最新トレンド分析

    Drive / GitHub など横断検索 特定業務や部門に合わせて コード不要でカスタマイズ 経費レポート自動集計 カスタマーサポート用 FAQ Mail / Docs / Sheets など 業務アプリケーション連携 メール対応・シート分析 会議要約 → ドキュメント作成
  7. AIツール利用 既存のAIツール(ChatGPT、Copilotなど)を そのまま使っている AIエージェント開発 AI同士の組み合わせを定義・設計して 自律的なエージェントとして業務を任せている ④ LLMアプリ開発 APIやモデルを利用して 自社用のLLM搭載アプリを開発

    ③ ノーコード拡張 GPTsやGemini Gemsなどを使って プログラムを書かずに業務を自動化 ② ① あなたはどのレベル?段階的な AI活用 11 いずれも特有の技術的ハードル、アンチパターンが存在 出力が安定せず 再現性を担保できない プラットフォームの制約で 独自のロジックや API連携ができない PoC後に直面する 幻覚・遅延・コストの壁 エージェントの連携不備 無限ループや 意図しない APIコールを誘発
  8. AIエージェントのデザインパターン(参考 : Cheat Sheets - by Avi Chawla) 13 パターン

    ポイント 例 Reflection エージェント自身が回答を自己レビュー →改善を繰り返し精度を上げる エッセイ、コー ドレビュー Tool Use 外部API / DB / Pythonなどのツール呼 び出しで知識・行動範囲を拡張 ナレッジ検索、 計算、DB照会 ReAct Reason + Actを組み合わせ、自己反省 + ツール実行でタスクを前進 Web操作、 データ収集、 ゲーム攻略 Planning 目標達成までのサブタスクを洗い出し、 ロードマップを立案して順序実行 コード生成パ イプライン、長 期タスク Multi-agent 複数エージェントが役割分担し、相互に タスクを委任しながらゴールへ到達 複雑プロジェ クト管理、社 内Q&A
  9. python run.py "社内文書のFAQチャットボットを構築して" Live Demo: LangGraphを活用した SWE-Agentの実装 14 ログ(node) 何をしているか?

    planner 計画: ユーザーの要求を具体的な開発タスクに分解 retriever 情報収集: タスクに必要な情報を検索 developer コード生成 : LLMがコードを生成 reviewer_self 自己レビュー : 書いたコードを自ら改善 reviewer タスクレビュー : 今回はデモ用に自動承認 system タスク管理: 次のタスクに進むか、完了したか判断
  10. エージェントの役割分担 : • Planner: ユーザー要求をタスクに分解 • Retriever: 開発に必要な情報を自律的に検索 • Developer:

    計画と情報に基づきコード生成 • Reviewer Self: コードの品質をレビュー • Reviewer: タスクが完了しているかレビュー ポイント: • LangGraphを用いてエージェント間の連携(ループ や条件分岐)を状態グラフとして定義 • 安定性を高める多層的アプローチ( ReAct, Reflection, Fallback) • run.pyを実行するだけで、計画からコード生成、レ ビューまでが一気通貫で実行 Live Demo: SWE-Agentの設計 15 Planner (Planning) START Retriever (Tool Use + ReAct) Developer Reviewer Self (Reflection) Reviewer Task Manager END [All tasks complete] [More tasks] Multi-agent Reflection Loop ReAct Loop
  11. Live Demo: 適材適所のモデル選択 16 今回のデモ:速度 +コスト重視・現実解版 最も重要な開発工程にのみ専門家を配置 し、残りは高速・低コストモデルが担当。レ ビューは自動承認で、速度を優先 models:

    planner: o3-mini retriever: o3-mini developer: claude-3-5-sonnet-20241022 reviewer_self: o3-mini reviewer: (自動承認) 理想パターン:品質最優先・高コスト版 すべての工程に、その分野で最も優秀な専 門家(高価だが最高性能なLLM)を配置 models: planner: o3 retriever: o3 / gpt-4o developer: claude-opus-4-20250514 reviewer_self: gpt-4o reviewer: o3 / gpt-4o
  12. swe-agent/ ├── 📄 run.py ├── 📄 graph.py ├── 📄 config.yml

    ├── 📂 agents/ │ ├── planner.py │ └── ... ├── 📂 tools/ │ ├── ingest.py │ └── chroma_client.py ├── 📂 data/docs/ │ ├── company_policies.txt │ ├── it_guidelines.md │ └── benefits.json └── 📂 dist/faq_bot/ Live Demo: ファイル構成の概要 17 run: メインの実行スクリプト。ここから全てが始まる graph: LangGraphを使い、エージェント達の連携フローを定義 config: 使用するモデルやコスト上限などを設定する設定ファイル agents/: 5体のエージェントの具体的な処理を実装 tools/: 文書を取り込み、ベクトル化するなどの補助ツール群 data/docs/: AIに学習させる元のドキュメント置き場 dist/faq_bot/: AIが最終的に生成したアプリケーションを格納
  13. Live Demo: SWE-Agentが生成したコードの例 18 質問応答用スクリプト (query.py) # ChromaDBに接続する def setup_vector_store(store_path:

    str) -> PersistentClient: # ... # 入力された質問でベクトル検索を実行し、関連情報を取得す る def search_documents(...) -> List[dict]: # ... results = collection.query(...) return documents # 検索結果を整形して、ターミナルに表示する @app.command() def query(...) -> None: # ... print("\n関連する情報:") ドキュメント取り込み用スクリプト (ingest.py) # 指定されたディレクトリからドキュメントを読み込む def get_document_files(source_dir: Path) -> List[Path]: # ... # ドキュメントを意味のある塊(チャンク)に分割する def process_documents( files: List[Path], chunk_size: int = 1000, chunk_overlap: int = 200 ) -> List[tuple[str, str]]: # ... # ChromaDBに接続し、ベクトルストアを作成・保存する def main(...) -> None: # ... collection.add(...)
  14. 1. ドキュメントの取り込み(ベクトル化と登録) python dist/faq_bot/tools/ingest.py --src data/docs --persist vector_store 2. 質問応答

    python dist/faq_bot/tools/query.py "リモートワークは可能ですか?" Live Demo: 生成されたアプリの使い方と実行結果の例 19
  15. How から Why への橋渡し 20 なぜ作るか (ビジネス的な価値 ) どう作るか (技術的な可能性

    ) AI活用の本質は「何が作れるか」ではなく「何を解決すべきか」を定義すること 1. 各種データを横断的に分析 2. 課題解決の計画を立案 3. 人間が計画をレビューし、承認 4. 承認に基づき、PoCコードを自動生成 「KPIレポート自動化ツール」 「顧客別・提案内容の最適化スクリプト」 Live Demo: SWE-Agent
  16. AIエージェントを構想するための 5つの視点 22 視点 問うべき問い 勝ち筋の具体例 目的 Why 業務のどの価値を「いつまで に・何%」改善するか?

    問い合わせ初回解決率: 90日以内に65%→80% 営業担当1人あたりの月間商談数:半年以内に 10件→15件 ユースケースと 展開戦略 What / Where どこから始め、どう横展開す るか? CS部門でFAQ自動化→全チャネル24時間対応へ 営業でリード評価自動化→他拠点へ展開 方法論 How どのタスクをどのAIエージェ ントに任せるか? 営業Copilot:商談メモ→次アクション提案→CRM更新 ナレッジナビゲーター:契約書横断検索 →要点抽出 サプライチェーンエージェント:需要予測 →自動発注 ROIと ガバナンス Value / Risk ROIをどう定量化し、リスク管 理を行うか? ROI試算=(削減工数×人件費)−運用コスト ログによる監査証跡、PII・著作権管理を自動化 組織と運用 People / Ops 誰が責任を持ち、どう運用・ 改善を続けるか? 専任Agent Opsチームがメトリクス管理と改善を実施 社員向けリスキリング講座と評価制度の見直し
  17. Algionが提供する AIエージェント導入ロードマップ 23 導入フェーズ Algionが支援する内容 具体的なサービス(抜粋) 戦略策定(導入前) 課題設定/KPI設計 ROI評価とユースケース特定 AI戦略コンサルティング

    データ戦略コンサルティング 検証・PoC(初期導入) 最速で成功パターンの検証 PoC実施と評価 業務自動化AIエージェント AIナレッジ検索ソリューション 本番導入 / 全社展開 (拡張導入・サービス統合) 業務やプロダクトへの統合 運用体制構築 成功パターンの横展開 生成AI導入基盤 生成AIマネージドプラットフォーム (β準備中) 継続運用と定着化 継続的な改善サイクル 内製化と人材育成 運用・MLOpsサポート 教育支援・AI人材育成