Upgrade to Pro — share decks privately, control downloads, hide ads and more …

初手AIで実現する 「AIと一緒に働く」ということ - AIファーストを実現する汎用タスクエー...

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

初手AIで実現する 「AIと一緒に働く」ということ - AIファーストを実現する汎用タスクエージェントのつくりかた / JAWS DAYS 2026

Avatar for 吉田真吾

吉田真吾

March 07, 2026

More Decks by 吉田真吾

Other Decks in Technology

Transcript

  1. 西見 公宏(にしみ まさひろ) 株式会社ジェネラティブエージェンツ代表 #アジャイル開発 #生成AI #AIエージェント #新規事業 #中学生からプログラマ #富士山の麓に移住

    生誕〜/ゲーム開発 1983年 兵庫生まれ/東京育ち 中学生時代からプログラミング に親しみ、CGIによるWebサー ビス開発やDirectXを利用した 同人ゲーム開発などを行う。初 めて触ったのはC言語。 起業/Web制作 2001年頃からWebデザイナー として活動開始 法人向けWebサイトの受託制 作からスタートし、法人向け CMS、デザインテンプレート の開発/提供を行う。 就職/大規模開発 顧問CTO/サービス開発 現在/生成AI 2008年〜TIS株式会社 財務会計領域を中心にERPコン サルタントとして従事。金融か ら製造業まで経験。大規模デー タから会計仕訳を自動生成する 仕組みのソリューション化。 2011年〜株式会社ソニックガーデン 設立期に1人目社員としてジョイン。 顧問CTOとして企画から開発まで従 事。アジャイル開発特化。2015年に 取締役就任。年間100件以上の新規 事業相談に対応、PJ立ち上げ。 2024年〜株式会社ジェネラティブ エージェンツ創業:AIエージェン ト書籍の上梓をきっかけにAIエー ジェント活用事例の展開を加速す るため3人の共同創業者と共に新 会社を設立。事業拡大に奔走中。 https://my.prairie.cards/u/mah_la b 2023/12/16発売! #専門誌連載 #書籍執筆 ▼MBTI ENFP(外向、直観、感情、知覚的態度) ▼ストレングスファインダー 最上志向、収集性、戦略性、未来志向、適応性 ▼趣味 筋トレ、プログラミング、子どもと遊ぶこと マイパーソナリティ #子ども4人 #イヌ #ベンチプレス #BBQ
  2. 【最新】AIエージェント開発の解説書 現場で活用するためのAIエージェント実践入 門 7月17日発売、Amazonで好評発売中 著者:太田 真人(Sakana AI), 宮脇 峻平 (Algomatic),

    西見 公宏 (Generative Agents), 後藤 勇輝 (電通総研), 阿田木 勇八 (電通総研) 「第1部 AIエージェントを知る」の前半ではAIエージェントの定義や重要な性質、ビジネ ス状況、活用例を説明します。 後半は技術観点でAIエージェントを構成する各技術要素の説明と実装上で気をつけるこ とを説明しています。開発者の方に興味を持っていただける内容です。 「第2部 AIエージェントを作る」では、どの会社でもありそうな課題に対してAIエージ ェントを開発していきます。さまざまな応用事例をもとに、AIエージェントの構築方法 が学べます。実装したAIエージェントを業務に適合させるため、精度を高める方向性や 課題にも触れています。読者がすぐに実装を再現でき、読者の環境に合わせて改変して 業務利用できることを意識しています。 「第3部 AIエージェントを活用する」では、実際にAIエージェントのプロジェクトを進 めるうえで、避けては通れないAIエージェントの評価やUX、リスクについて解説します。 また、継続的なAIエージェントの改善についても解説します。 最後に各社の取り組み方法や考え方について説明します。 2026年ITエンジニア本大賞 特別賞受賞!
  3. 【最新】AIコーディングの実践的解説書 『実践Claude Code入門―現場で活用するためのAIコーディングの思考法』(技術評論社) 西見公宏、吉田真吾、大嶋勇樹 [著] 第1部 手を動かして学ぶClaude Codeの基本 第1章 Claude

    Codeをソフトウェアエンジニアリングと統合する 第2章 Claude Codeの基礎 第3章 MCPを使いこなせ! 第4章 達人に学ぶスペック駆動開発 第5章 Claude Code Actionの活用 第2部 動作原理を理解して開発フローを仕組み化する 第6章 Claude Codeの動作原理を理解する 第7章 Claude Codeを意図通りに動かす 第8章 スペック駆動開発のフローを仕組み化する【設計編】 第9章 スペック駆動開発のフローを仕組み化する【実践編】 2025年12月26日発売!
  4. 会社名 株式会社ジェネラティブエージェンツ (英文:Generative Agents, Inc.) 所在地 東京都港区 ※ 全社員リモート勤務 役員構成

    CEO 西見 公宏 COO 吉田 真吾 CTO 大嶋 勇樹 設立年月 2024年3月14日 事業内容 AIエージェント技術を軸とした生成AIアプリケーショ ン開発支援、コンサルティング、教育・研修サービ スの提供 AIエージェントインテグレーションサービスの提供 AIエージェントを実業務で本当に活用するためには、AIエージェントの技 術特性と問題解決領域の両面から検討を進める必要があります。当社は 「LangChain」の公式エキスパートとして、AIエージェントを開発するた めの確かな技術力を活かし、生成AIアプリケーション開発支援からコンサ ルティング、教育・研修サービスまでのあらゆる方面において、AIエージ ェントを活用した問題解決サービスを提供します。 インテグレーションを支えるサービス群の提供 AIエージェントを効果的に運用するためには、AIエージェントを動かすた めのインフラが必要です。当社はマルチエージェントのオーケストレーシ ョン基盤である「tasq0 - タスクゼロ(※開発中)」をはじめ、AIエージ ェントのためのツール群「middleman.ai」の提供を通して、AIエージェン ト活用のための基盤構築をサポートします。 株式会社ジェネラティブエージェンツ - 会社概要 AIエージェントが「ハブ」となり 人間とAIエージェントの協働が 当たり前になる世界を実現する
  5. AIエージェントを中心に業務を回す会社を作れないか?(2024年〜) Slack kintone ※MTG書き起こしデータなど データ検索基盤 実験計画 完了した 実験 実験レポ データ抽出

    お問い合わせ 提案書 人間が生成するデータに影響を与える 案件 活動資金 組織に実装 情報発信 認知 アセット化 Github
  6. AIとの協働スタイル スケールアップ スケールアウト アンビエントエージェント 人間 AI 人間 AI AI AI

    人間 AI AI AI イベント • 一人の生産性を底上げ • 常に人間の応答が必要 • 同期的な操作(半非同期) • 人間がボトルネック 例:ChatGPTなどのチャット型AI • 非同期かつ自律的 • 複数タスクの並行処理 • 人間の関与は減少 • AIへの依頼量がボトルネック 例:ソフトウェア開発エージェント (Devin等) • 非同期かつ自律的 • イベント駆動型 • 必要時のみ人間に問い合わせ • イベント量がボトルネック 例:Agent Inbox (LangChain)
  7. 2025年5月、Claude Code Actionsの登場 2025年5月後半にClaude Code Actionsが公開される。 GitHub Actions上でClaude Codeを動かす仕組み。外 部への通信を行わせないなど、セキュリティ対策込

    みの仕組み。 主な用途はGitHubのIssue管理やプルリクへのオート レビュー。 GitHubで動かすのでソフトウェア開発 向けの仕組みに見えるが、やっている ことはシンプルにClaude Codeをリモー トで動かすということだよな・・・。
  8. 固定資産税リマインド | 毎年12月20日の09:00に実行(0 9 20 12 *) 未完了タスクリマインド(週次) | 毎週月曜日の09:00に実行(0

    9 * * 1) 請求書チェック(A-3-1 + A-3-2) | 毎週月曜日の09:00に実行(0 9 * * 1) 勤怠・経費登録リマインド(月次) | 毎月1日の09:00に実行(0 9 1 * *) 源泉所得税リマインド(1月) | 毎年1月5日の09:00に実行(0 9 5 1 *) 役員賞与リマインド | 毎年1月5日の09:00に実行(0 9 5 1 *) 法定調書等リマインド | 毎年1月5日の09:00に実行(0 9 5 1 *) 健康保険料率リマインド | 毎年3月20日の09:00に実行(0 9 20 3 *) 住民税反映リマインド | 毎年5月20日の09:00に実行(0 9 20 5 *) 社員賞与(夏)リマインド | 毎年6月5日の09:00に実行(0 9 5 6 *) 賞与支払届リマインド(6月) | 毎年6月15日の09:00に実行(0 9 15 6 *) 算定基礎届・年度更新リマインド | 毎年6月20日の09:00に実行(0 9 20 6 *) 源泉所得税リマインド(7月) | 毎年7月1日の09:00に実行(0 9 1 7 *) そして、全て解決したように見えたが・・・ これをメンテし続けるのか?
  9. まとめ • LLMアプリケーションはメンテナンスコストが高い ◦ ワークフローなので確実性は高いが、プロンプトチューニングと モデルアップデートの負荷が高い。少人数組織では難がある。 • アンビエントエージェントは自然言語を愚直にコード実行するだけ ◦ アンビエントエージェントによって指示待ちからは解放されるが

    空気を読んでタスクをつくりだしてくれるわけではない。 • 本当に欲しい物は「新しい同僚」だった→『初手AI』への気付き ◦ 人間がどういう風に仕事をしているかを考えたら おのずと分かる問題だった。 ◦ LLMの性能向上と共に理想を実現しやすくなってきている。
  10. エージェントハーネスとは? 参考資料:The importance of Agent Harness in 2026 https://www.philschmid.de/agent-harness-2026 エージェントハーネスとは、AIモデルを包み込み、長時間にわたるタスク実行を管理・制御するソフトウェア基盤である。エージ

    ェントそのものではなく、エージェントが安定的・効率的に動作し続けるための「運用環境」にあたる。 エージェント (アプリケーション) AIモデル (CPU) コンテキストウィンドウ (RAM) エージェントハーネス(OS) なぜハーネスが必要か? 現在のAIモデルは単発の応答では高い性能を示す一方、50回・100回とツールを呼び 出す長時間タスクでは指示から逸脱しやすい。この「持久力」の問題は従来のベン チマークでは捉えにくく、モデル単体の改善だけでは解決しない。ハーネスはこの 課題について3つの価値を提供する。 1. 実運用での性能検証: 新モデルを自社のユースケースで即座に比較・評価で きる共通基盤となる 2. ユーザー体験の底上げ: 実績あるツールやベストプラクティスを組み込むこ とで、モデルの潜在能力を最大限引き出す 3. フィードバックループの構築: エージェントの実行軌跡を構造化データとし て蓄積し、モデルやシステムの継続的な改善につなげる 特に3点目は重要で、ハーネスが記録する軌跡データこそが次のモデル学習の材料に なる。つまりハーネス自体がデータセットとしての役割を持つ。
  11. エージェント (アプリケーション) AIモデル (CPU) コンテキストウィンドウ (RAM) コンテキストエンジニアリング 限られたメモリ(RAM)を管理。 情報の圧縮や外部保存を行い、記憶 領域を最適化する。必要な情報を上

    手く読み出す戦略も範疇。 独自の制御構造の提供 サブエージェントやエージェントチ ームといったエージェント間連携機 能や、エージェントに特化した高度 な計画機能の提供など。 エージェントはハーネスを通じて 実タスクを実行する。 タスクに最適化された システムプロンプトを持つ ガードレール ライフサイクルフックによってエー ジェントの行動を制御。Doom判定な どによる失敗パターンからの復帰や、 ルールベース制御など。 実行制御とツール連携 OSのドライバのように機能。 プロンプトのプリセット管理や、外 部ツールの呼び出しを標準化する。 MCPの呼び出しなど。 エージェントハーネス(OS)
  12. エージェントの品質をどのように担保するか? エージェント (アプリケーション) AIモデル (CPU) コンテキストウィンドウ (RAM) エージェントハーネス(OS) エージェントハーネスを 上手く用いて目標(タスク)を

    達成できるか? (E2E評価、軌跡評価) エージェントハーネスの意図通 りにツール呼び出しなどが動作 するか?(軌跡評価) ハーネスが期待通りに エラーなく動作するか? (ソフトウェアテスト)
  13. まとめ • LLMアプリケーションからAIエージェントへ ◦ LLMの性能向上と低価格化により、高性能モデルを妥当な金額で 扱うことができるようになってきた。 ◦ LLMアプリケーションはAPIコスパは良いがメンテコストが高い。 • AIエージェント中心の業務フロー『初手AI』をいかにデザインするか

    ◦ 業務単体の自動化はインパクトが薄い。AIエージェントを中心に 業務を回すため、人間との関わりをどうデザインするかがポイント。 • AIエージェントはつかうべきか、つくるべきか ◦ 既製のもので実行不可能なタスクはそもそも実現できない可能性が ある。精度やコストの問題は解決できる。
  14. 48

  15. Aさん 若ければ安心?年齢がいってるから不安? 20代 30代 40代 50代 Fさん Kさん Pさん Bさん

    Gさん Lさん Qさん Cさん Hさん Mさん Rさん Dさん Iさん Nさん Sさん Eさん Jさん Oさん Tさん
  16. Aさん 若ければ安心?年齢がいってるから不安? 20代 30代 40代 50代 Fさん Kさん Pさん Bさん

    Gさん Lさん Qさん Cさん Hさん Mさん Rさん Dさん Iさん Nさん Sさん Eさん Jさん Oさん Tさん ❌
  17. Aさん 若ければ安心?年齢がいってるから不安? 20代 30代 40代 50代 Fさん Kさん Pさん Bさん

    Gさん Lさん Qさん Cさん Hさん Mさん Rさん Dさん Iさん Nさん Sさん Eさん Jさん Oさん Tさん ❌
  18. Aさん 若ければ安心?年齢がいってるから不安? 20代 30代 40代 50代 Fさん Kさん Pさん Bさん

    Gさん Lさん Qさん Cさん Hさん Mさん Rさん Dさん Iさん Nさん Sさん Eさん Jさん Oさん Tさん ❌
  19. 変革をリードできる人 > 変革の8段階プロセス(ジョン・P・コッター) 1. 危機意識の醸成(Urgency) 現状維持では将来のリスクが高まることを組織全体で共有し、「変革が必要である」という共通認 識を形成する。 2. 変革推進チームの形成(Guiding Coalition)

    変革を推進するための強力なリーダーシップチームを結成し、意思決定と実行を加速させる。 3. ビジョンと戦略の策定(Vision & Strategy) 変革の方向性を明確にしたビジョンと、それを実現するための戦略・ロードマップを策定する。 4. ビジョンのコミュニケーション(Communicate the Vision) ビジョンを組織全体に浸透させ、一人ひとりが「自分ごと」として捉えられるようにする。 5. 社員のエンパワーメント(Empower Broad-Based Action) 現場の社員が、自ら変革を推進できるよう、権限・リソース・能力を付与する。 6. 短期的な成果の創出と可視化(Generate Short-Term Wins) 早期に目に見える成果を出し、変革への信頼と勢いを高める。 7. 成果の定着とさらなる変革の推進(Consolidate Gains & Produce More Change) 短期的な成功を土台に、より大きな変革を継続的に推進し、組織に定着させる。 8. 新しい文化の定着(Anchor New Approaches in the Culture) 変革で得られた新しい行動・価値観を、組織文化として根付かせる。
  20. Claude Code / Cowork におけるエンタープライズコラボレーションの課題 Mob Elabolation 機能の不在 実行環境がローカルである •

    Multi-Agents, Single-Human • リポジトリは共有できても作業は git worktreeで分断 • 意思決定の瞬間や、アドバイザリ としてセッションへの介入ができ ない • チーム共有作業でも個人Macで実行 ex. 商談準備、カレンダー更新、お問い 合わせ対応 etc… • 端末は諸事情で実行性が乏しい ex. スリープしていて定時起動失敗、持 ち出していて環境に接続不可、認証情 報がExpired、個人作業と混ざる...
  21. aidlc-workflows : INCEPTION (意図〜要求詳細化〜ストーリーのユニット化)の卓越さ https://github.com/awslabs/aidlc-workflows • INCEPTION→CONSTRUCTION→OPERATION = INCEPTIONが最重要 •

    意図の抽出、要求の詳細化、ユーザーストーリー • 質問表化して作業を永続化、答えやすい選択肢 • aidlc-stateによる状態管理、auditによるログ管理 • あいまいなまま先に進むことを徹底的に防止する ハーネス →使い勝手が良すぎる
  22. 変革をリードしたいなら... ❑ AIエンジニアリングマスター研修 AI-DLC, 仕様駆動開発をチームで実践 ❑ Claude Code 実践研修 Claude

    Code, 仕様駆動開発を基礎から徹底解説+ハンズオン ❑ AIコーディング道場 サービス企画からリリースまで2ヶ月で実践