Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIに任せる範囲を安全に広げるためにやっていること
Search
Masashi Fukuzawa
February 25, 2026
Programming
160
0
Share
AIに任せる範囲を安全に広げるためにやっていること
「AIコーディング現状確認会 2026福岡」というイベントで発表した内容です。
ref.
https://connpass.com/event/383789/
Masashi Fukuzawa
February 25, 2026
More Decks by Masashi Fukuzawa
See All by Masashi Fukuzawa
ACES Meet の「2025年」を振り返る
fukucheee
0
69
ACES Meet におけるリリース作業改善の取り組み
fukucheee
0
370
Other Decks in Programming
See All in Programming
ファインチューニングせずメインコンペを解く方法
pokutuna
0
270
PDI: Como Alavancar Sua Carreira e Seu Negócio
marcelgsantos
0
100
Radical Imagining - LIFT 2025-2027 Policy Agenda
lift1998
0
250
Migration to Signals, Signal Forms, Resource API, and NgRx Signal Store @Angular Days 03/2026 Munich
manfredsteyer
PRO
0
240
へんな働き方
yusukebe
6
2.9k
PCOVから学ぶコードカバレッジ #phpcon_odawara
o0h
PRO
0
220
Codex CLI でつくる、Issue から merge までの開発フロー
amata1219
0
330
GNU Makeの使い方 / How to use GNU Make
kaityo256
PRO
16
5.6k
Laravel Nightwatchの裏側 - Laravel公式Observabilityツールを支える設計と実装
avosalmon
1
320
LM Linkで(非力な!)ノートPCでローカルLLM
seosoft
0
410
L’IA au service des devs : Anatomie d'un assistant de Code Review
toham
0
210
Coding at the Speed of Thought: The New Era of Symfony Docker
dunglas
0
4.7k
Featured
See All Featured
ラッコキーワード サービス紹介資料
rakko
1
2.9M
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
260
Embracing the Ebb and Flow
colly
88
5k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
A Tale of Four Properties
chriscoyier
163
24k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Everyday Curiosity
cassininazir
0
190
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.8k
AI: The stuff that nobody shows you
jnunemaker
PRO
4
520
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
The browser strikes back
jonoalderson
0
900
Tell your own story through comics
letsgokoyo
1
890
Transcript
AIに任せる範囲を 安全に広げるためにやっていること 福澤 将史 | ACES Inc. | テックリード AIコーディング現状確認会
2026福岡 | 2026.02.25
AI駆動開発の4フェーズと現在地 ▲ 私たちは今ここ — Phase 3 の入口
自走と統制を両立する3つの仕掛け ループ構造 plan.md → 実装/検証 → worklog記録 → DR抽 出
→ plan.md更新 DR(Decision Required) AIが判断できない時だけ停止。A/B形式で人間は選ぶ だけ ガードレール 認証・課金・コアロジック等「任せない領域」を事前定義 Pilot-Tower開発 + 3つの仕掛け Pilot-Tower開発(P&T開発) AI = Pilot(操縦) plan.mdを読み、実装→検証→ログ記録のループを自走 人間 = Tower(管制塔) 意思決定のみ。DRへの回答で介在 plan.md がそのタスクにおけるSSoT Goal / Constraints / DoDを記載 AIが読み更新する生きた仕様書 「人間の関与を最小化し、AIの自律稼働時間を最大化する開発」は一定程度実現できつつある 数ヶ月運用でAI実装起因のインシデントは0件 ここまでは上手くいった。問題はこの先 → 「人間の関与を最小化し、AIの自律稼働時間を最大 化する」ことを目指した独自フレームワーク
現在の悩みポイント:PRレビュー AIのPRは大きくなりがち。人間のレビューが追いつかない 自走してくれる。品質ゲート (Lint, Tests, Self Review, Codex/Opus Review) も通る。
しかし変更差分の大きなPRが量産されても、人間側のレビューが追いつかない。 「これ本当に出しても良いのかな...?」という不安が残り続ける。 暫定対処 タスク分解に時間を使う・PR分割コマンドを利用す ることで人間がPRを見やすいように調整 → 人間がボトルネックになりやすく、本質的な解では ないと思っている ステータス チーム内で未解決 今一番悩んでいるポイント
この問題は一過性かもしれない レビューの前提が変わるなら、PR粒度の問題も構造ごと変わりうる → 今の対処と未来への投資を分けて考える "The concept of understanding and reviewing
code is a dying paradigm." コードを理解してレビューするという行為自体が 「死にゆくパラダイム」だという主張 Thomas Dohmke @ashtom | 元GitHub CEO のツイートより一部抜粋 https://x.com/ashtom/status/2021255786966708280
暫定策 vs 本命の投資先 暫定策 人間の介在を増やす 人間の手数を増やすことで 品質を担保している状態 ⚠ 人間の介在が増えると スケールしないことは分かっている
リリース安全網 壊れても速く直せる仕組み 「壊れないようにする」だけでは限界 「壊れても速く直せる」 に発想を転換 リリース判断を「人間の目視」から 「データとシステム」に移す
早く検知し、早くリカバリする 01 Progressive Delivery Feature Flag + カナリアリリースで段階的にリリース。 異常時は自動ロールバック。 02
Observability Sentry APM + Grafana でデプロイ起因の異常を早 期検知。 03 SLI/SLO / Error Budget リリース可否を感覚ではなくデータで判断。エラーバ ジェットで定量的に管理。 04 Error Triage Automation エラー発生 → 原因分類 → 対応PR自動生成。人間は判 断だけ。 4つが揃うと → AIが書いたコードでも安心して本番に出せる。 高速にロールバックできるならPR粒度は致命傷にな らない。理想的にはここを目指していきたい。
まとめ 1 Pilot-Tower開発で「人間の関与を最小化し、AIの自律稼働時間を最大化する 開発」は一定程度実現できつつある 2 PRの粒度問題は今一番の悩みポイント。だが人間レビュー前提のパラダイム自体 が変わりつつある 3 本命の投資先はリリース安全網。壊れても速く直せる仕組みがあれば、AIへの委 譲範囲はさらに広がる
テックブログ 「AIネイティブな組織づくり」 シリーズ 本日公開