Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIにレビューを任せる仕組みと見えてきた次の課題
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
uo
May 19, 2026
Technology
86
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
AIにレビューを任せる仕組みと見えてきた次の課題
uo
May 19, 2026
More Decks by uo
See All by uo
実装計画を活用しAIの効果を最大化する
uo
1
62
gRPCでの効率的なAPI開発とテストの進め方
uo
2
490
Other Decks in Technology
See All in Technology
On-behalf-of Token exchange with AgentCore Identity
hironobuiga
2
230
日本 Fintech 未来予測レポート 2027〜2028年(オリジナル版)
8maki
0
2.3k
Claude Code の Sandbox 機能を Anthropic Sandbox Runtime(srt) で試そう!/lets-play-anthropic-sandbox-runtime
tomoki10
1
620
LayerXにおけるセキュリティ管理の現在地と次の一手
tosho
0
220
【NRUG vol.18】なぜ多くのオブザーバビリティ導入は失敗するのか
nrug_member
0
170
Bedrock AgentCore RuntimeでAuth0 Changelog調査AIをアップグレードした話
t5u8a5a
1
170
いまさら聞けない「仕様駆動開発入門」 〜AI活用時代の開発プロセスを考える〜
findy_eventslides
2
150
アンオフィシャルな、オフィシャルからのお願い
wyamazak_devrel
0
120
マルチアカウント環境での コーディングエージェントを使った障害調査が大変なので AIエージェントにReadOnly権限を付与してみた / ReadOnly AI Agents for Multi-Account AWS Incident Response
yamaguchitk333
2
110
AAIFに入ってみた ~内から見えるコミュニティ動向~
sato4
0
250
【Cyber-sec+】経営層を"動かす"ための考え方
hssh2_bin
0
190
小さく始める AI 活用推進 ― 日経電子版 Web チームの事例/nikkei-tech-talk47
nikkei_engineer_recruiting
0
270
Featured
See All Featured
Building Flexible Design Systems
yeseniaperezcruz
330
40k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Ethics towards AI in product and experience design
skipperchong
2
310
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
56k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
1
350
A Soul's Torment
seathinner
6
2.9k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
940
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
610
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
It's Worth the Effort
3n
188
29k
Transcript
AIにレビューを任せる仕組みと 見えてきた次の課題 株式会社カウシェ / バックエンドエンジニア 魚住伸
カウシェでは約80%のPRをAIレビューだけでマージしています 今日お話しすること 1. AIレビューの仕組み 2. AIレビューとAIマージの壁 3. AIマージを取り入れた結果
AIレビューの仕組み Claude Code ActionでAIでのレビューを実行 多視点設計: コーディネーター + 並列サブエージェント シニアGoエンジニア (実装品質)
シニアアーキテクト (設計妥当性) コーディネーターが総合判定 変更対象ごとに専用のレビューワークフロー コード系: backend / front / platform 設計・仕様系: PRD / DesignDoc / proto → 各ワークフローに専用プロンプト + 専用ナレッジ
自己改善の仕組み 5つのエージェントが毎日深夜に動き、改善を行う エージェント 役割 やっていること measure 計測係 昨日のAIレビューを採点、APPROVE/REJECTを数字で記録 explore 探検係
リポジトリ・本番メトリクスを調査、異常を発見 improve 実行係 ルール・プロンプト・ワークフローを書き換えてPR化 reflect 司令塔 明日は何に集中するかの作戦 (strategy.md) を書く audit 監査役 数字が嘘ついてないか観察、勧告のみ (コード変更なし) → 詳細は弊社テックブログを参照ください: 全PRの83%をAIレビューだけでマージできるようにした
AIレビュー ≠ AIマージ AIレビュー単体でも価値がある 型不整合 / nil 参照 / 既知のセキュリティパターン
AIは人間が見逃しそうなことを拾ってくれる でも、AIマージ (人間レビュー無しで本番投入) は別の話 AIレビューは 「確率論」 で動いている 同じPRでも、セッションが違えば判断が異なる 100%信用できるとは言えない、AIにマージまで任せて大丈夫なのか?
アプリケーションの何を守るべきなのか
何を守るか? 軸は 「失敗してもリカバリーができるか」 AIが間違っても、戻しやすい・修正しやすい箇所ならAIに任せる。 守る (人間もレビューする) ユーザー影響: クリティカルな振る舞い / セキュリティ
/ データ整合性 技術構造: DBスキーマ / APIの定義 / 共有ライブラリ AIマージ OK = リカバリーしやすいもの 実装の詳細、コードの可読性 人間がコードを読むことが少なくなったので、可読性の重要度は以前より下がった 仮に技術負債としてたまっても、AIと後からリファクタ可能
任せた箇所での責任の保ち方 AIにマージまでは任せるが、最終的なリリース責任は人間にしている。 品質を守る仕組み CUJ (Critical User Journey)で人間が見るべき重要な導線を定義 → ECなら、トップ画面 →
商品閲覧 → 購入完了 API仕様ファースト + E2Eテスト → protoにAPI仕様を記載、記載された仕様をE2Eテストで確認するフロー すぐ戻せる仕組み Cloud Runの素早いロールバック ── リビジョンをすぐ戻せる AIにマージを任せる判断ができたのは、ここの仕組みがあることが大きい
AIマージの結果 AI導入前 現在 open → レビューまで 2時間 20分 レビュー →
マージまで 5時間 40分 合計 (cycle time) 7時間 1時間 → 約7倍の高速化 → 特に「レビュー待ち」(open → レビュー) が大幅短縮 ── AIが一次レビューをしてくれる効果
課題① 理解負債 (Comprehension Debt) AIが生成したコードの仕組みを、開発者が理解できない状態が増えている 知識共有のサイクルがなくなった 以前: PRレビュー = チームメンバーがコードを理解する場
今: 実装レビューをAIに任せた結果、このサイクルがなくなった 非対称性 設計のレビュー = 人間 → 設計レベルの知識共有は残る 実装のレビュー = AI → 実装の詳細は、担当した人以外は誰も知らない 実際に動いているコードを、どうすればもっと深く理解した状態を維持できるか、が 次の課題
課題② レビュー精度 AIがApproveしたPRでも3割は人間指摘あり → AIレビューはまだ完璧ではない 人間が拾っている指摘で一番多いのはドメイン知識 「このサービスは過去にこういう判断をした」 「このドメインではこの命名が一般的」 「この外部APIはこの順序で叩かないと整合性が崩れる」 →
プロンプトでドメイン知識を渡しているが、漏れることがある
まとめ 失敗してもリカバリーができる領域はAIにマージを任せている リカバリーしにくいものは人間も見る コード生成を任せた箇所の責任は人間に残す 次の課題 ① 理解負債 ② AIレビュー精度
ご清聴ありがとうございました