Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2026-06-24_人とAIの責務分離に基づく開発プロセスの提案.pdf

 2026-06-24_人とAIの責務分離に基づく開発プロセスの提案.pdf

Avatar for matsui-dmm

matsui-dmm

June 24, 2026

More Decks by matsui-dmm

Other Decks in Technology

Transcript

  1. © DMM © DMM CONFIDENTIAL ⼈とAIの責務分離に基づく 開発プロセスの提案 ― BSDD: Boundary

    Spec Driven Development ― AIに⾃律的な実⾏を委ねるために,⼈は何を定義すべきか 1
  2. © DMM 3 • 名前︓松井 ⾼宏 • 所属︓ DMM.com •

    専⾨︓ AX推進 / AIプロダクト開発 • 研究テーマ:人とAIの協調・責務分離 ー ⾃⼰紹介 ー 昨年、DICOMO優秀論⽂賞を受賞 今年は、AIに⾃律実⾏を委ねる 開発プロセス (BSDD)を提案する
  3. © DMM 課題︓仕様化の範囲の曖昧さ A) Vibe Coding 仕様がなく, ⼈が決めるべき判断までAIが補完してしまう B) SDD(仕様駆動開発)

    仕様は構造化できるが、 期待通りに実装させようとするほど記述範囲が広がりやすい 9 本質は、仕様の有無ではなく、 ⼈が仕様として確定すべき範囲が曖昧なことにある
  4. © DMM 本研究の新規性 • SDD(仕様駆動開発) 仕様を構造化し,AI実装につなげる • BSDD(境界仕様駆動開発) ⼈が定義すべき範囲とAIに任せる範囲の境界( Boundary

    )を扱う開発プロセス 11 ⼈が定義する 範囲 AIに任せる 範囲 例:画面項目やAPI契約は 人が決め, 設計・実装をAIに任せる
  5. © DMM (A)境界定義層の全体フロー 15 1. プロダクト⽬的から要求を把握する 2. AIの⽀援により,サービス間で合意する 仕様を抽出・整理する 3.

    ⼈が境界仕様として確定、 実⾏層への⼊⼒とする 実行層の前に 人が責任を持って 合意すべき仕様を切り出す
  6. © DMM (A)境界仕様の判断基準と代表例 16 • 境界仕様に含む項⽬は「サービス間で合意が必要な仕様か」の軸で判断する ※関係ロールとの合意も含む • 固定ルールではなく, 案件ごとの合意影響により変わる

    境界仕様として含む例 • 背景・⽬的 • ユースケース • 画⾯WF・遷移 • API I/O • 外部連携データ 実行層へ委譲する例 • 内部設計 • 実装⽅針 • テストケース • タスクリスト • モデル内部構造 これら境界仕様は、サービス間で合意すべき対象を切り出した 「システムの⾻格」としての仕様である
  7. © DMM (A)境界仕様の例 目的 → 価値・振る舞い 17 2.UseCase 各サービス間の振る舞いを合意 1.User

    Story Map どんな価値を実現するか合意 • 境界仕様の重要事項は図で構造化することで,認知負荷を下げ, 早期合意を図る
  8. © DMM (B)ハーネス:自律実行を支える 22 • ハーネスとは,近年注⽬される AIの⾃律実⾏を⽀える基盤技術である • BSDDでは,実⾏層において AIにプロダクト・サービス固有の

    知識・制約・検証⽅法を与える • これによりAIは, 実⾏計画に沿って 安定して実装・検証を進めることが 可能となる
  9. © DMM 結果2. 仕様記述範囲の集約 25 • 従来SDD︓AIに期待通り実装させるため,仕様が詳細化しやすい • BSDD︓⼈が記述する範囲をサービス間合意である境界仕様へと集約した BSDD

    境界仕様 要件定義 基本設計 詳細設計 実装方針 テスト観点 内部設計 詳細設計 実装方針 テスト観点 内部設計 従来SDD 人が記述しがちな範囲 人の記述範囲 AIの具体化範囲
  10. © DMM 結果2. 仕様記述範囲の集約 26 • 記述範囲を集約した結果,仕様記述量・仕様策定⼯数は削減できた • 境界仕様をもとに実装した結果, 観測範囲で重⼤障害等は発⽣していない

    • これらは初期的な確認であるが, 実運⽤への適⽤可能性を⽰すものである 項目 対象 従来SDD (中央値) BSDD (中央値) 削減率 仕様記述量 20件 1,213行 228行 84.5% 仕様策定工数 8件 4h 1h 75% 重大障害・RB 8件 ー 発生なし ー ※厳密な因果推定ではなく,初期的な適用可能性の確認である
  11. © DMM 結論 27 • BSDDでは,⼈が合意すべき境界仕様を定義し,具体化をAIの実⾏層に委譲した • その結果,⼈の確認⼯程と仕様記述範囲は集約され, 設計意図を保ちながら, 開発プロセスを効率化できることを確認した

    • 本研究の意義は,⼈とAIの責務境界を定めることで ⼈が重要な判断に集中し, AIが具体化を担う開発プロセスを⽰した点にある • 今後は評価⽅法を厳密化し, 適⽤範囲を広げつつ再現性と有効性を検証する
  12. © DMM 33 Q. BSDDは、ハーネスを決める取り組みで すか? • ハーネス整備も含まれますが、主目的ではありません。 BSDDでは、人が決めることとAIに任せることを整理し、その実行を支えるものと してハーネスを位置づけています。

    Q. BSDDにすると品質が下がりませんか? • 品質を下げる考え方ではありません。仕様、実行計画、PRの確認は従来どおり重 視し、人が確認すべきポイントを明確にすることを目的としています。 Q. 各社のAI開発支援ツールとの違いは何で すか? • 各社ツールは、AIの実行を支援するものです。BSDDは、その前段として、人が何 を決め、どこからAIに任せるかを整理する考え方です。 Q. 実装後にAIへコード要約させれば、仕様 は不要ではないですか? • コード要約は実装結果の理解には有効です。ただし、事前に何を合意し、なぜそ う判断したかまでは残りにくいため、BSDDでは実装前に境界仕様を整理します。 Q. 境界仕様の判断は主観的になりません か? • 判断基準として、サービス間合意が必要かを見ます。画面、API、ロール、データ、 業務ルールなど、複数の関係者に影響するものは境界仕様として扱います。 Q. どの開発に適用できますか? • 主に、APIなどで複数サービスが連携するWeb開発を対象としています。 モノリスやゼロから作る開発への適用は、今後の検証対象です。 Q. AIが想定どおりに実装しない場合はどう しますか? • 個別に人が実装を代替するのではなく、ルールや知識、スキルなどの実行基盤を 見直します。ただし、合意事項に関わるずれは、境界定義層に戻って確認します。 Q. データモデルなどは 境界仕様に含まれるのでは? • 場合によります。業務上の概念・状態・API応答など,複数サービスに影響する内 容は境界仕様に含めます。一方,テーブル定義やモデル内部の詳細は, 原則として実行層でAIに具体化させます。その妥当性は、実行計画で確認します 補足:Q&A
  13. © DMM 34 Q.単一サービスの開発には適用できま せんか? • 適用できます。単一サービスでも,プロダクト目的・振る舞い・受入条件など,他 者と合意すべき内容が必要な場合は境界仕様として扱います。一方,単一サービス 内で完結する設計・実装の具体化は,原則として実行層でAIに委譲します。 Q.

    品質評価は十分ですか? • 現時点では初期評価として、境界仕様どおりの外部挙動になっているか、重大な障 害やロールバックが発生していないかを確認しています。内部品質、保守性、レビ ュー負荷、欠陥密度などは、今後さらに評価していく対象です。 Q. 今後、どのように評価を厚くします か? • 欠陥密度、レビュー指摘数、レビュー工数、複雑度、変更容易性、リリース後障害 件数などを見ていく予定です。品質・保守性・運用品質への影響を、より多面的に 確認していきます。 Q. なぜサービス間合意を境界にするの ですか? • 複数のロールやサービスに影響する内容は、人が責任を持って合意しておく必要が あるためです。そのため、サービス間合意を境界仕様の判断基準にしています。 Q. 境界仕様が不足していた場合はどう しますか? • 外部挙動や関係者間の合意に影響する場合は、境界定義層に戻って確認します。 実行層だけで無理に調整しないようにします。 Q. 実行計画は詳細設計ではないのです か? • 詳細設計ではなく、AIがどの単位で実装を進めるかを確認するための実装計画です。 人は、実装の進め方や分割単位が妥当かを確認します。 Q. ハーネスが未成熟でも使えますか? • 使うことはできますが、効果は限定的です。 • AIが安定して実行できるようにハーネスの整備も重要になります。 Q. 評価の前提条件は何ですか? • 仕様記述量は、同一20案件で従来SDD文書とBSDD境界仕様を比較しています。 工数や品質は、API 1本追加の実案件8件を対象に確認しています。 • なお、厳密な因果推定ではなく、実運用上成立するかを確認した初期評価です 補足:Q&A