初手AIで実現する「AIと一緒に働く」ということ - AIファーストを実現する汎用タスクエージェントのつくりかた / JAWS DAYS 2026

初手AIで実現する「AIと一緒に働く」ということ AIファーストを実現する汎用タスクエージェントのつくりかた株式会社ジェネラティブエージェンツ西見公宏 / 吉田真吾 2026年3月7日
JAWS DAYS 2026

西見公宏（にしみまさひろ）株式会社ジェネラティブエージェンツ代表 #アジャイル開発 #生成AI #AIエージェント #新規事業 #中学生からプログラマ #富士山の麓に移住
生誕〜／ゲーム開発 1983年兵庫生まれ／東京育ち中学生時代からプログラミングに親しみ、CGIによるWebサービス開発やDirectXを利用した同人ゲーム開発などを行う。初めて触ったのはC言語。起業／Web制作 2001年頃からWebデザイナーとして活動開始法人向けWebサイトの受託制作からスタートし、法人向け CMS、デザインテンプレートの開発／提供を行う。就職／大規模開発顧問CTO／サービス開発現在／生成AI 2008年〜TIS株式会社財務会計領域を中心にERPコンサルタントとして従事。金融から製造業まで経験。大規模データから会計仕訳を自動生成する仕組みのソリューション化。 2011年〜株式会社ソニックガーデン設立期に1人目社員としてジョイン。顧問CTOとして企画から開発まで従事。アジャイル開発特化。2015年に取締役就任。年間100件以上の新規事業相談に対応、PJ立ち上げ。 2024年〜株式会社ジェネラティブエージェンツ創業：AIエージェント書籍の上梓をきっかけにAIエージェント活用事例の展開を加速するため3人の共同創業者と共に新会社を設立。事業拡大に奔走中。 https://my.prairie.cards/u/mah_la b 2023/12/16発売！ #専門誌連載 #書籍執筆 ▼MBTI ENFP（外向、直観、感情、知覚的態度） ▼ストレングスファインダー最上志向、収集性、戦略性、未来志向、適応性 ▼趣味筋トレ、プログラミング、子どもと遊ぶことマイパーソナリティ #子ども4人 #イヌ #ベンチプレス #BBQ

AIエージェント開発に関する主な著書 2023年12月16日発売一般向け AIエージェント解説書 2024年11月9日発売開発者向け AIエージェント解説書 2023年10月号から連載実践 LLMアプリケーション開発

【最新】AIエージェント開発の解説書現場で活用するためのAIエージェント実践入門 7月17日発売、Amazonで好評発売中著者：太田真人（Sakana AI）, 宮脇峻平 (Algomatic),
西見公宏 (Generative Agents), 後藤勇輝 (電通総研), 阿田木勇八 (電通総研) 「第1部 AIエージェントを知る」の前半ではAIエージェントの定義や重要な性質、ビジネス状況、活用例を説明します。後半は技術観点でAIエージェントを構成する各技術要素の説明と実装上で気をつけることを説明しています。開発者の方に興味を持っていただける内容です。「第2部 AIエージェントを作る」では、どの会社でもありそうな課題に対してAIエージェントを開発していきます。さまざまな応用事例をもとに、AIエージェントの構築方法が学べます。実装したAIエージェントを業務に適合させるため、精度を高める方向性や課題にも触れています。読者がすぐに実装を再現でき、読者の環境に合わせて改変して業務利用できることを意識しています。「第3部 AIエージェントを活用する」では、実際にAIエージェントのプロジェクトを進めるうえで、避けては通れないAIエージェントの評価やUX、リスクについて解説します。また、継続的なAIエージェントの改善についても解説します。最後に各社の取り組み方法や考え方について説明します。 2026年ITエンジニア本大賞特別賞受賞！

【最新】AIコーディングの実践的解説書『実践Claude Code入門―現場で活用するためのAIコーディングの思考法』（技術評論社）西見公宏、吉田真吾、大嶋勇樹 [著] 第1部手を動かして学ぶClaude Codeの基本第1章 Claude
Codeをソフトウェアエンジニアリングと統合する第2章 Claude Codeの基礎第3章 MCPを使いこなせ！第4章達人に学ぶスペック駆動開発第5章 Claude Code Actionの活用第2部動作原理を理解して開発フローを仕組み化する第6章 Claude Codeの動作原理を理解する第7章 Claude Codeを意図通りに動かす第8章スペック駆動開発のフローを仕組み化する【設計編】第9章スペック駆動開発のフローを仕組み化する【実践編】 2025年12月26日発売！

本日の流れ

本日の流れ（全体）【今日のゴール】明日からAIエージェントとの協働をスタートすることができる！ GA社の事例からAIエージェントとの協働の解像度を上げる具体的になにから始めたらよいか？前半後半

本日の流れ（前半パート） 1. してきたこと 2. 分かったこと 3. 取り組むこと【ゴール】 AIエージェントと一緒に働くために辿ったプロセスを追体験することで、協働の解像度が高まること
AIエージェントと一緒に働くために...

これまでにしてきたこと＆分かったこと

会社名株式会社ジェネラティブエージェンツ（英文：Generative Agents, Inc.）所在地東京都港区 ※ 全社員リモート勤務役員構成
CEO 西見公宏 COO 吉田真吾 CTO 大嶋勇樹設立年月 2024年3月14日事業内容 AIエージェント技術を軸とした生成AIアプリケーション開発支援、コンサルティング、教育・研修サービスの提供 AIエージェントインテグレーションサービスの提供 AIエージェントを実業務で本当に活用するためには、AIエージェントの技術特性と問題解決領域の両面から検討を進める必要があります。当社は「LangChain」の公式エキスパートとして、AIエージェントを開発するための確かな技術力を活かし、生成AIアプリケーション開発支援からコンサルティング、教育・研修サービスまでのあらゆる方面において、AIエージェントを活用した問題解決サービスを提供します。インテグレーションを支えるサービス群の提供 AIエージェントを効果的に運用するためには、AIエージェントを動かすためのインフラが必要です。当社はマルチエージェントのオーケストレーション基盤である「tasq0 - タスクゼロ（※開発中）」をはじめ、AIエージェントのためのツール群「middleman.ai」の提供を通して、AIエージェント活用のための基盤構築をサポートします。株式会社ジェネラティブエージェンツ - 会社概要 AIエージェントが「ハブ」となり人間とAIエージェントの協働が当たり前になる世界を実現する

AIエージェントを中心に業務を回す会社を作れないか？（2024年〜） Slack kintone ※MTG書き起こしデータなどデータ検索基盤実験計画完了した実験実験レポデータ抽出
お問い合わせ提案書人間が生成するデータに影響を与える案件活動資金組織に実装情報発信認知アセット化 Github

AIとの協働スタイルスケールアップスケールアウトアンビエントエージェント人間 AI 人間 AI AI AI
人間 AI AI AI イベント • 一人の生産性を底上げ • 常に人間の応答が必要 • 同期的な操作（半非同期） • 人間がボトルネック例：ChatGPTなどのチャット型AI • 非同期かつ自律的 • 複数タスクの並行処理 • 人間の関与は減少 • AIへの依頼量がボトルネック例：ソフトウェア開発エージェント（Devin等） • 非同期かつ自律的 • イベント駆動型 • 必要時のみ人間に問い合わせ • イベント量がボトルネック例：Agent Inbox (LangChain)

AIエージェントに業務コンテキストを与えるためのAgentic CRMの開発（2024年）【課題意識】そもそもどのような経緯からどのような話になったのか、時系列での具体的な情報がLLMに提示されていない限り、LLMの力を発揮することはできない。

SlackからGPTsのようにエージェントを起動できる仕組みの開発（2024年）普段使いしているビジネスチャットシステムから簡単に呼び出せないと使い勝手が悪いし、Slackでの会話そのものも全て保存しておいて、あらゆる経緯を理解しておいて欲しい。 Agentic CRMのコンテキストも理解して現実的なタスクをこなせるようにしたい。

エージェントが現実のタスクをこなせるようにするためのツール群の開発（2024年） Environment（環境） Perception（知覚） Brain（思考） Action（行動）ビジネス環境におけるデータを知覚できるか？ LLMによって思考しやすいデータ形式になっているか？ビジネス環境に適したデータ
に変換できるか？成果物として通用するフォーマットで出力して欲しい（マークダウンは求めていない）

で、どうなった？（2024年）プロンプトチューニングと保守開発で死ぬ

（ちなみに）ここまでのノウハウをまとめた本が「赤い鳥」の本ですこちらの書籍では後半の反省をもとにどのようにAIエージェントとの協働をデザインするかについても書いています。

2024年末、DevinのGA 隔離されたVMにGitHubリポジトリをクローンし、その上でエージェント実行が可能。 Slackでコミュニケーションできる。

・・・もしかして、去年作ったアレ、Devinで良くない？ファイルシステムも含めて情報探索可能なエージェントと Slackでコミュニケーションできるようにしたかった。

2025年2月〜サブスクリプション利用できるコーディングエージェントの登場 2025年2月後半にresearch previewが公開される。当時は3.5 opus & 3.7 sonnet。 2025年4月にサブスクリプションプラン提示。 2025年5月に4.0
sonnet & 4.0 opusのリリースと共に一般提供開始（GA）となった。 https://claude.com/blog/max-plan

2025年5月、Claude Code Actionsの登場 2025年5月後半にClaude Code Actionsが公開される。 GitHub Actions上でClaude Codeを動かす仕組み。外部への通信を行わせないなど、セキュリティ対策込
みの仕組み。主な用途はGitHubのIssue管理やプルリクへのオートレビュー。 GitHubで動かすのでソフトウェア開発向けの仕組みに見えるが、やっていることはシンプルにClaude Codeをリモートで動かすということだよな・・・。

AIエージェントキャッチアップをClaude Code Actionsで運用するいけるかも知れない？

2025年7月31日 Study Co - 大嶋勇樹「Claude Codeが働くAI中心の業務システム構築の挑戦」

（ちなみに）あらゆる業務にClaude Codeを活用して得たノウハウはウニ本に書きましたエージェントを意図通りに動かすことに妙にこだわって書かれている理由はつまりそういうことです。

2025年7月31日 Study Co - 大嶋勇樹「Claude Codeが働くAI中心の業務システム構築の挑戦」

トリガー駆動（アンビエントエージェント）のそもそもの課題イベントに対して処理をするだけでは「業務」の遂行になっていない • 例えば「お問い合わせ」一つ取っても、業務は「返信するだけ」ではない ◦ 見積りを求められている場合は見積りを出す必要がある ◦ 例外的な対応を相談されている場合は別途考える必要がある ◦ →返信文を生成すればオッケー、ではないことがほとんど
• つまり、一つのイベントに対して複数のタスクがアドホックに存在しており、人間はそのタスクを上手く管理しながら業務を完遂させている。 👉であれば、AIエージェント自身にタスク管理をさせれば良いのでは・・・？

アンビエントエージェントを越えていく - タスクゼロの開発

トリガーベースではなく、自身でミッション達成に向けてタスクを起票＆実施 AIエージェントにタスクマネジメントを委譲する

トリガーベースではなく、自身でミッション達成に向けてタスクを起票＆実施このように「人間主導でタスクマネジメントしてAIに仕事を委譲する」パラダイムから「AI主導でタスクマネジメントして人間と協働する」パラダイムへの移行のことを、私たちは「初手AI」と呼んでいます。というか、そういう風にデザインしないと、人間は永遠にAIにお仕事を与える係になる・・・。

AI協働の進化ロードマップ対話型から自律型へ。主導権が「人間」から「AI」へと移行するパラダイムシフト

イベントタスク管理システムエージェント業務マニュアル・ツール（スクリプト）イベントが発生したらタスクが登録されるタスクを実施すべきタイミングでエージェントが起動して処理するエージェントに依頼された
タスクを実施する必要に応じて人間に対応依頼参照・使用 Claude Code GitHub AIエージェントと人間との協働のハブ

まとめ • LLMアプリケーションはメンテナンスコストが高い ◦ ワークフローなので確実性は高いが、プロンプトチューニングとモデルアップデートの負荷が高い。少人数組織では難がある。 • アンビエントエージェントは自然言語を愚直にコード実行するだけ ◦ アンビエントエージェントによって指示待ちからは解放されるが
空気を読んでタスクをつくりだしてくれるわけではない。 • 本当に欲しい物は「新しい同僚」だった→『初手AI』への気付き ◦ 人間がどういう風に仕事をしているかを考えたらおのずと分かる問題だった。 ◦ LLMの性能向上と共に理想を実現しやすくなってきている。

AIエージェントの導入に向けて、どう取り組むべきか

イベントタスク管理システムエージェント業務マニュアル・ツール（スクリプト）イベントが発生したらタスクが登録されるタスクを実施すべきタイミングでエージェントが起動して処理するエージェントに依頼された
タスクを実施する必要に応じて人間に対応依頼参照・使用？？？ GitHub 初手AIのような全体デザインと「AIエージェント」そのものの実装

実行エージェントの変遷 ①既存コーディングエージェントによるPoC ②既存エージェントSDKによるPoC ③独自エージェントハーネスの構築今ココ

エージェントハーネスとは？参考資料：The importance of Agent Harness in 2026 https://www.philschmid.de/agent-harness-2026 エージェントハーネスとは、AIモデルを包み込み、長時間にわたるタスク実行を管理・制御するソフトウェア基盤である。エージ
ェントそのものではなく、エージェントが安定的・効率的に動作し続けるための「運用環境」にあたる。エージェント（アプリケーション） AIモデル（CPU）コンテキストウィンドウ（RAM）エージェントハーネス（OS）なぜハーネスが必要か？現在のAIモデルは単発の応答では高い性能を示す一方、50回・100回とツールを呼び出す長時間タスクでは指示から逸脱しやすい。この「持久力」の問題は従来のベンチマークでは捉えにくく、モデル単体の改善だけでは解決しない。ハーネスはこの課題について3つの価値を提供する。 1. 実運用での性能検証：新モデルを自社のユースケースで即座に比較・評価できる共通基盤となる 2. ユーザー体験の底上げ：実績あるツールやベストプラクティスを組み込むことで、モデルの潜在能力を最大限引き出す 3. フィードバックループの構築：エージェントの実行軌跡を構造化データとして蓄積し、モデルやシステムの継続的な改善につなげる特に3点目は重要で、ハーネスが記録する軌跡データこそが次のモデル学習の材料になる。つまりハーネス自体がデータセットとしての役割を持つ。

エージェント（アプリケーション） AIモデル（CPU）コンテキストウィンドウ（RAM）コンテキストエンジニアリング限られたメモリ（RAM）を管理。情報の圧縮や外部保存を行い、記憶領域を最適化する。必要な情報を上
手く読み出す戦略も範疇。独自の制御構造の提供サブエージェントやエージェントチームといったエージェント間連携機能や、エージェントに特化した高度な計画機能の提供など。エージェントはハーネスを通じて実タスクを実行する。タスクに最適化されたシステムプロンプトを持つガードレールライフサイクルフックによってエージェントの行動を制御。Doom判定などによる失敗パターンからの復帰や、ルールベース制御など。実行制御とツール連携 OSのドライバのように機能。プロンプトのプリセット管理や、外部ツールの呼び出しを標準化する。 MCPの呼び出しなど。エージェントハーネス（OS）

エージェントハーネスの類型 Claude用のハーネス（Bunで開発） GPT Codex用のハーネス（Rustで開発）マルチモデル対応のハーネスマルチモデル対応のハーネス LangChain製のマルチモデルハーネス（汎用エージェント）

エージェントの品質をどのように担保するか？エージェント（アプリケーション） AIモデル（CPU）コンテキストウィンドウ（RAM）エージェントハーネス（OS）エージェントハーネスを上手く用いて目標（タスク）を
達成できるか？（E2E評価、軌跡評価）エージェントハーネスの意図通りにツール呼び出しなどが動作するか？（軌跡評価）ハーネスが期待通りにエラーなく動作するか？（ソフトウェアテスト）

エージェンティックワークフロー（Dify等）とエージェントハーネスの違いエージェンティックワークフローエージェントハーネス •ユーザーが自分の手で個々の処理をフローとして繋ぎ合わせ、作成する •決められた通りに動作するため安定性が高い •ワークフローは増え続けるため、保守に注意が必要 •AIエージェントがユーザーの要求に応じてオンデマンドでワークフローを生成する •ユーザーの要求を達成するフローが必ず生成されると
は限らないため、活用のためのマネジメントが必要

AIエージェント開発プロジェクトの進め方エージェントスキルなどを特定タスク向けに構築し、既存コーディングエージェントにタスクをやらせてみて、タスクを達成できるかどうかを検証する。そのまま活用しても良い。 ①既存コーディングエージェントによるPoC 既存エージェントハーネスを用いるか、開発を実施し、①で成功したタスクの達成率を強化、ステップ数の軽減、利用モデルの省力化を行う。①より安価なモデルで業務を達成することを狙う。 ②エージェントハーネスを用いた業務特化 ③エージェンティックワークフローの構築
より多くのワークロードを安定的に実行した場合はエージェンティックワークフローを構築する。タスク毎に開発するために保守コストが発生するので、特別にチューニングしたいものに限定。

前半のまとめ

まとめ • LLMアプリケーションからAIエージェントへ ◦ LLMの性能向上と低価格化により、高性能モデルを妥当な金額で扱うことができるようになってきた。 ◦ LLMアプリケーションはAPIコスパは良いがメンテコストが高い。 • AIエージェント中心の業務フロー『初手AI』をいかにデザインするか
◦ 業務単体の自動化はインパクトが薄い。AIエージェントを中心に業務を回すため、人間との関わりをどうデザインするかがポイント。 • AIエージェントはつかうべきか、つくるべきか ◦ 既製のもので実行不可能なタスクはそもそも実現できない可能性がある。精度やコストの問題は解決できる。

本日の流れ（全体）【今日のゴール】明日からAIエージェントとの協働をスタートすることができる！ GA社の事例からAIエージェントとの協働の解像度を上げる具体的になにから始めたらよいか？前半後半

具体的になにから始めたらよいか？

そもそも何か始めないといけないのか？

AIによる失業 GPU > Job Secutiry https://newsdig.tbs.co.jp/articles/withbloomberg/2511646

Aさん若ければ安心？年齢がいってるから不安？ 20代 30代 40代 50代 Fさん Kさん Pさん Bさん
Gさん Lさん Qさん Cさん Hさん Mさん Rさん Dさん Iさん Nさん Sさん Eさん Jさん Oさん Tさん

Aさん若ければ安心？年齢がいってるから不安？ 20代 30代 40代 50代 Fさん Kさん Pさん Bさん
Gさん Lさん Qさん Cさん Hさん Mさん Rさん Dさん Iさん Nさん Sさん Eさん Jさん Oさん Tさん ❌

上位20%の優秀層の条件アンケート) 生成AI利用状況 1. 毎日利用している 2. 開発業務に利用している / 業務に利用している 3.
Claude Codeを利用している / Claude on Bedrockを利用している

生成AIを使いこなしているから大丈夫？＜原始人乙

生成AIを使いこなしているから大丈夫？あなたが楽してるだけでは？

上位20%の優秀層の条件変革をリードできる人 1. 圧倒的な優秀さ常に他の人よりも優秀であり続けることが大前提となります。上位10%のトップタレントとして、自身の専門スキルと適応能力を絶えず研鑽し続ける姿勢が不可欠です。 2. 変革のリーダーシップただ与えられた業務で生産性を上げるだけでは不十分です。組織や社会に対して自ら変革をリードし、新しい価値を創造して「稼げる人材」になることが強く求められます。

変革をリードできる人 > 変革の8段階プロセス（ジョン・P・コッター） 1. 危機意識の醸成（Urgency）現状維持では将来のリスクが高まることを組織全体で共有し、「変革が必要である」という共通認識を形成する。 2. 変革推進チームの形成（Guiding Coalition）
変革を推進するための強力なリーダーシップチームを結成し、意思決定と実行を加速させる。 3. ビジョンと戦略の策定（Vision & Strategy）変革の方向性を明確にしたビジョンと、それを実現するための戦略・ロードマップを策定する。 4. ビジョンのコミュニケーション（Communicate the Vision）ビジョンを組織全体に浸透させ、一人ひとりが「自分ごと」として捉えられるようにする。 5. 社員のエンパワーメント（Empower Broad-Based Action）現場の社員が、自ら変革を推進できるよう、権限・リソース・能力を付与する。 6. 短期的な成果の創出と可視化（Generate Short-Term Wins）早期に目に見える成果を出し、変革への信頼と勢いを高める。 7. 成果の定着とさらなる変革の推進（Consolidate Gains & Produce More Change）短期的な成功を土台に、より大きな変革を継続的に推進し、組織に定着させる。 8. 新しい文化の定着（Anchor New Approaches in the Culture）変革で得られた新しい行動・価値観を、組織文化として根付かせる。

エンタープライズなコラボレーションの実現 Mob Elabolation

エンタープライズなコラボレーションの実現 AI-DLC AIが対話を開始し主導するAIファーストアプローチ

エンタープライズなコラボレーションの実現 Mob Elabolation

エンタープライズなコラボレーションの実現 Multi Agents, Single Human Multi Agents, Multi Human

1. Claude Code を汎用タスクエージェントとして活用

Claude Code / Cowork におけるエンタープライズコラボレーションの課題 Mob Elabolation 機能の不在実行環境がローカルである •
Multi-Agents, Single-Human • リポジトリは共有できても作業は git worktreeで分断 • 意思決定の瞬間や、アドバイザリとしてセッションへの介入ができない • チーム共有作業でも個人Macで実行 ex. 商談準備、カレンダー更新、お問い合わせ対応 etc… • 端末は諸事情で実行性が乏しい ex. スリープしていて定時起動失敗、持ち出していて環境に接続不可、認証情報がExpired、個人作業と混ざる...

エンタープライズなコラボレーションの実現タスクゼロジェネラティブエージェンツ社はCursorやClaude Codeのローンチ以来、一貫して 1. コーディングエージェントを汎用タスクエージェントとしての活用 2. エンタープライズなコラボレーションの実現を主軸に活動

2. エンタープライズなコラボレーションの実現 • クラウド上での安全でロバストな実行性 • 誰でも作業に介入できるマルチエージェント・マルチヒューマン

aidlc-workflows : INCEPTION (意図〜要求詳細化〜ストーリーのユニット化)の卓越さ https://github.com/awslabs/aidlc-workflows • INCEPTION→CONSTRUCTION→OPERATION = INCEPTIONが最重要 •
意図の抽出、要求の詳細化、ユーザーストーリー • 質問表化して作業を永続化、答えやすい選択肢 • aidlc-stateによる状態管理、auditによるログ管理 • あいまいなまま先に進むことを徹底的に防止するハーネス →使い勝手が良すぎる

汎用タスクエージェントの作業ハーネスとしてもとても有効

変革をリードしたいなら... ❑ AIエンジニアリングマスター研修 AI-DLC, 仕様駆動開発をチームで実践 ❑ Claude Code 実践研修 Claude
Code, 仕様駆動開発を基礎から徹底解説＋ハンズオン ❑ AIコーディング道場サービス企画からリリースまで2ヶ月で実践

（ちなみに）あらゆる業務にClaude Codeを活用して得たノウハウはウニ本に書きましたエージェントを意図通りに動かすことに妙にこだわって書かれている理由はつまりそういうことです。

全体のまとめ

まとめ • AIエージェント中心の業務フロー『初手AI』をいかにデザインするか ◦ 業務単体の自動化はインパクトが薄い。AIエージェントを中心に業務を回すため、人間との関わりをどうデザインするかがポイント。 • 変革をリードせよ ◦ この先生き残るのは変革をリードできる人材
• 自動化ではなく高い作業品質の実現を目指せ ◦ LLMの高い推論能力を引き出すステアリングポリシーの管理 ◦ すべての作業はInceptionから

We are hiring! お前もエージェントビルダーにならないか？

ご清聴ありがとうございました

初手AIで実現する 「AIと一緒に働く」ということ - AIファーストを実現する汎用タスクエー...

初手AIで実現する 「AIと一緒に働く」ということ - AIファーストを実現する汎用タスクエージェントのつくりかた / JAWS DAYS 2026

More Decks by 吉田真吾

Other Decks in Technology

Featured

Transcript

初手AIで実現する「AIと一緒に働く」ということ - AIファーストを実現する汎用タスクエー...

初手AIで実現する「AIと一緒に働く」ということ - AIファーストを実現する汎用タスクエージェントのつくりかた / JAWS DAYS 2026