Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ハーネスエンジニアリングをやりすぎた話 ~そのハーネスは解体された~

Avatar for Gota Gota
April 24, 2026

ハーネスエンジニアリングをやりすぎた話 ~そのハーネスは解体された~

本発表では、AIエージェントによるソフトウェアの長時間自律開発を可能にする「エージェントハーネス」の構築と、その失敗の経緯を共有する。
仕様承認後、放置で大規模開発を完了させることを目指し、タスク分解、並列実行、検証可能、証跡付きといった機能を盛り込んだ。最初、中規模開発に成功したことが最悪の成功体験となり、様々な開発に対応させるべく機能を拡張しすぎた。その結果、ハーネス自体が過度に密結合・肥大化し、修正や検証が困難になる制御不能な状態に陥り、最終的に解体した。
結論として、ハーネスを作成する際は目的ごとに小さく分割し、シンプルで変更容易性の高いハーネスを構築する必要がある

Avatar for Gota

Gota

April 24, 2026

More Decks by Gota

Other Decks in Technology

Transcript

  1. 自己紹介 2 Gota (@gota_bara) 所属 やってること AI エージェント開発 / ⼩売向けデータプロダクト

    / データ整備 好きなエージェント pi … 超シンプルなTerminal型エージェント. システムプロンプトを⼈間が容易に読める cc-sdd v3.0 (2026/4 update) • 境界をファーストクラス化 • ⻑時間の⾃律実装:specのTDD実装 ↔ レビューのClosed Loop • Slash commandをAgent Skillsに変更 Agentic AI エンジニア & アナリティクスエンジニア
  2. 様々なソフトウェア開発に対応出来るハーネスにしたい! 9 ⾊々と範囲を広げてすぎて依存がどんどん増えていく... そして⾃由度が下がっていく 1 2 3 ⽂書テンプレートがたくさん! • アーキテクチャ設計書

    • データモデル / ERD / エン ティティ定義 • 機能仕様書 / 画⾯仕様書 • API仕様書 • 業務フロー / ユースケース • モジュール設計 / コンポーネ ント境界 • ⾮機能要件 • etc. 決定論的だけじゃなく推論も! 設定ファイルだけで300⾏超 様々なドキュメント 様々な検証 様々な技術スタック
  3. ハーネスが密結合に... 11 タスクのテンプレートを 1 個変えたいだけで、10 箇所の整合性をとる必要が... 1 template / hook

    / verify / tests / policy が同時に動く. 汎⽤的 に作ってるから変更箇所が多い 2 1回全体をテストするのに平気 で1時間とかの⻑時間かかる. 3 修正してもどこを修正したから うまくいった/失敗したのかを 評価不能に そしてエージェントハーネスは肥⼤化 Script: 25,000⾏‧Markdown: 10,000⾏‧Hooks: 1,500⾏
  4. まとめ: 今だったらこう分ける! 14 1 Planning Agent 要求‧計画からタスク契約に落とす 2 Execution Agent

    タスク契約を読む → 境界内でTDD実装する 3 Verification Agent タスク契約を読む → checks と evidence で完了判定する 4 Adaptation Agent failure / evidence を読む → 次の提案を出す ⽬的ごとに⼩さく分けてシンプルかつ変更容易性の⾼いハーネスを作ろう!