AIにレビューを任せる仕組みと見えてきた次の課題

AIにレビューを任せる仕組みと見えてきた次の課題株式会社カウシェ / バックエンドエンジニア魚住伸

カウシェでは約80%のPRをAIレビューだけでマージしています今日お話しすること 1. AIレビューの仕組み 2. AIレビューとAIマージの壁 3. AIマージを取り入れた結果

AIレビューの仕組み Claude Code ActionでAIでのレビューを実行多視点設計: コーディネーター + 並列サブエージェントシニアGoエンジニア (実装品質)
シニアアーキテクト (設計妥当性) コーディネーターが総合判定変更対象ごとに専用のレビューワークフローコード系: backend / front / platform 設計・仕様系: PRD / DesignDoc / proto → 各ワークフローに専用プロンプト + 専用ナレッジ

自己改善の仕組み 5つのエージェントが毎日深夜に動き、改善を行うエージェント役割やっていること measure 計測係昨日のAIレビューを採点、APPROVE/REJECTを数字で記録 explore 探検係
リポジトリ・本番メトリクスを調査、異常を発見 improve 実行係ルール・プロンプト・ワークフローを書き換えてPR化 reflect 司令塔明日は何に集中するかの作戦 (strategy.md) を書く audit 監査役数字が嘘ついてないか観察、勧告のみ (コード変更なし) → 詳細は弊社テックブログを参照ください: 全PRの83%をAIレビューだけでマージできるようにした

AIレビュー ≠ AIマージ AIレビュー単体でも価値がある型不整合 / nil 参照 / 既知のセキュリティパターン
AIは人間が見逃しそうなことを拾ってくれるでも、AIマージ (人間レビュー無しで本番投入) は別の話 AIレビューは「確率論」で動いている同じPRでも、セッションが違えば判断が異なる 100%信用できるとは言えない、AIにマージまで任せて大丈夫なのか？

アプリケーションの何を守るべきなのか

何を守るか? 軸は「失敗してもリカバリーができるか」 AIが間違っても、戻しやすい・修正しやすい箇所ならAIに任せる。守る (人間もレビューする) ユーザー影響: クリティカルな振る舞い / セキュリティ
/ データ整合性技術構造: DBスキーマ / APIの定義 / 共有ライブラリ AIマージ OK = リカバリーしやすいもの実装の詳細、コードの可読性人間がコードを読むことが少なくなったので、可読性の重要度は以前より下がった仮に技術負債としてたまっても、AIと後からリファクタ可能

任せた箇所での責任の保ち方 AIにマージまでは任せるが、最終的なリリース責任は人間にしている。品質を守る仕組み CUJ (Critical User Journey)で人間が見るべき重要な導線を定義 → ECなら、トップ画面 →
商品閲覧 → 購入完了 API仕様ファースト + E2Eテスト → protoにAPI仕様を記載、記載された仕様をE2Eテストで確認するフローすぐ戻せる仕組み Cloud Runの素早いロールバック ── リビジョンをすぐ戻せる AIにマージを任せる判断ができたのは、ここの仕組みがあることが大きい

AIマージの結果 AI導入前現在 open → レビューまで 2時間 20分レビュー →
マージまで 5時間 40分合計 (cycle time) 7時間 1時間 → 約7倍の高速化 → 特に「レビュー待ち」(open → レビュー) が大幅短縮 ── AIが一次レビューをしてくれる効果

課題① 理解負債 (Comprehension Debt) AIが生成したコードの仕組みを、開発者が理解できない状態が増えている知識共有のサイクルがなくなった以前: PRレビュー = チームメンバーがコードを理解する場
今: 実装レビューをAIに任せた結果、このサイクルがなくなった非対称性設計のレビュー = 人間 → 設計レベルの知識共有は残る実装のレビュー = AI → 実装の詳細は、担当した人以外は誰も知らない実際に動いているコードを、どうすればもっと深く理解した状態を維持できるか、が次の課題

課題② レビュー精度 AIがApproveしたPRでも3割は人間指摘あり → AIレビューはまだ完璧ではない人間が拾っている指摘で一番多いのはドメイン知識「このサービスは過去にこういう判断をした」「このドメインではこの命名が一般的」「この外部APIはこの順序で叩かないと整合性が崩れる」 →
プロンプトでドメイン知識を渡しているが、漏れることがある

まとめ失敗してもリカバリーができる領域はAIにマージを任せているリカバリーしにくいものは人間も見るコード生成を任せた箇所の責任は人間に残す次の課題 ① 理解負債 ② AIレビュー精度

ご清聴ありがとうございました

AIにレビューを任せる仕組みと見えてきた次の課題

AIにレビューを任せる仕組みと見えてきた次の課題

uo

More Decks by uo

Other Decks in Technology

Featured

Transcript