生成AI活用のROI、どう測る？ DMM.com 開発責任者から学ぶ「AI効果検証のノウハウ」 / ROI of AI

1 Masato Ishigaki  July. 19, 2025  生成AI活用のROI、どう測る？   DMM.com 開発責任者から学ぶ
  「AI効果検証のノウハウ」 

2 About me  石垣雅人  合同会社 DMM.com    プラットフォーム開発本部副本部長 
/ 第1開発部部長 / VPoE室 / アルファ室    ・連載中 : 『開発生産性の多角的視点』（CodeZine）   ・連載中 : 『スモールチームが武器になる時代へ』（ProductZine）   ・連載中 : 『群知能から紐解く、スケールする“組織“の作り方』（NewsPicks）    2

https://jp.findy-team.io/blog/ai-casestudy/ai_effectiveness_verification_dmm/ 話すこと  5

6 Table of Contents  - AIによって開発スタイルとスケーリングの違い  - AIへの投資と人への投資によるお金の変化  - AIエージェントへの投資対効果の投資と効果の基準 
- AI疲れ・レビュー負荷にどう立ち向かうか 

AIエージェントによる開発スタイルの変化  従来プロダクション現在成果物は物理的な時間と人が同期していた  ガードレール役に徹する（CodeRabbit等で短縮）プロダクション人の物理的な時間と成果物
が非同期で出てくる  これから成果物のレビューもAIへ LLM-as-a-judge 人は問い型へ  プロダクション 8

これから人は問い型へ  プロダクション 9 AIエージェントによる開発スタイルの変化  成果物のレビューもAIへ LLM-as-a-judge

人による量のスケーリングの終わり  10 人の増やして量を作る  2 pizzaで分解する  アジャイル × マイクロサービス   人とのコミュニケーションパス
が膨大  人とのコミュニケーションパスを縮小  AIで代替する  1チームあたりの  規模が縮小.AIとの対話へ 

11 ちなみに  AIが人を代替するのではなく、  AIを使っている人がAIを使っていない人を代替する 

人によるスケーリングから、AIによるスケーリング  + + + 人を増やして、スケール    個の生産性を上げて、スケール    個とAIを増やして、スケール   
+ Lead Time  早  スケール方法 12

人材関連費・給与手当・賞与・法定福利費・福利厚生費・地代家賃・採用費・販管費 / 支払い手数料
販管費/支払手数料（ライセンス料） P/L + + + + 人にかかるお金とAIにかけるお金による変化 +700万 +700万 +700万 +700万 +700万 +20万 +20万 +700万 +700万 +20万 +20万 +20万スケール方法 13

AIエージェントへの投資対効果について - 投資対効果の「投資の部分」  - AIエージェントやFindy Team+といったチームの生産性に寄与するものコスト（人件費は除く）   - 投資対効果の「効果の部分」 
- 生産量・リードタイム・個々の生産性（同じAIエージェントの金額でも数値は違う）  ・AIエージェント  ・Findy Team+  ・その他、チーム生産性に寄与するもの  ・生産量増  ・リードタイム短縮  ・1人あたりの生産性   output input 15

投資対効果の「投資の部分」チームごとのコストツールごとのコスト AIエージェントのツールは   使わないものは削る  

- 「感覚的には早くなっている」をどう自分たちの行動ログとして表出化させるか  - 定量データで言えば「AIに置き換え」と「AIとの協働」で難易度は違う  - └ AIに置き換え → 人でやっていたものを丸々削減時間とする  -
└ AI協働 → 人でやったときの予測とAI協働での実績比較やAAテストからのABテストはできないので移動平均などで抽出して行う  投資対効果の「効果の部分」 17

生産量・リードタイム・1人あたりの生産性  - 生産量 : ノイズを取り除いた状態でのPR数などの数的推移  - リードタイム : 類推見積りでおおよそ一致した施策のリードタイム比較  
- 1人あたりの生産性 : 同じAIエージェントの金額でも個々で成果がバラバラの場合が多い。そのため、 1人1人可視化していく必要あり  - SPACEなどの定性評価も組み合わせて筋が良さそうな指標を組み合わせて生産活動の変化傾向を見ていく  投資対効果の「効果の部分」 18

AIへの投資対効果の観点  - スピードと品質の両方を考慮する  - 品質を落として量産しても意味がない。逆に負荷がかかるだけになる   - 単一プロセスの最適化ではなく、バリューストリーム全体を見る  - 生産量が多くなっても、変更障害率が多くなっている等
 

Findy Team+, Findy AIによる比較  ある平均的な1チームの例（3ヶ月）  

Findy Team+, Findy AIによる比較  指標人間チーム Devin AI 勝者総合⽣産量
189件 74件⼈間チーム個別⽣産性 15.8件/⼈ 74件 Devin AI 継続性不規則 111⽇中74⽇活動 Devin AI ピーク⽣産 3件/⽇ (最⼤) 9件/⽇ (最⼤) Devin AI ある平均的な1チームの例（3ヶ月）   【生産性分析】 

Findy Team+, Findy AIによる比較  ある平均的な1チームの例（3ヶ月）   【品質分析】  指標人間チーム Devin
AI 勝者マージ率 85-90% 60.1% ⼈間チームレビュー品質⾃⼰完結型要⼈間確認⼈間チーム複雑度対応⾼度な設計可能定型作業のみ⼈間チームエラー率 10-15% 40% ⼈間チーム

Findy Team+, Findy AIによる比較  ある平均的な1チームの例（3ヶ月）   【作業内容分析】  人間チーム (189件) の作業分布
新機能開発 40% (76件) バグ修正‧改善 30% (57件) テスト実装 20% (38件) 保守‧リファクタ 10% (18件) Devin AI (74件) の作業分布コード変換 60% (44件) ‒ Kotlin-Java テスト変換 30% (22件) 機能改善 10% (8件)

AI疲れとレビュー負荷の違い  - AI疲れ  - Devin/ Cursor background agentを非同期で動かしながら手元では同期的にAIエージェントとvibe-codingをし
ているというメンバーが増える。AIのキャッチアップ疲れもある   - 使いすぎると単一時間あたりの業務密度が高くなり、人がバーンアウトするときもあるか  - 以前までは、働き過ぎの部分は残業などでキャッチしてきましたが、AI時代だとそうもいかないこともあるため、どう労務を見ていくかは思案し始めている   - レビュー負荷  - AIが作ったものをどう評価し、成果物としてリリースしていくかに抵抗がある組織も多い   - しかし、AIエージェントによる生産量が増えることは間違いないので、人によるレビュー限界が来る   - 一部、LLM as a Judgeの試験的導入をしているチームもある  

25 まとめ  - AIによって開発スタイルとスケーリングの違い  - AIへの投資と人への投資によるお金の変化  - AIエージェントへの投資対効果の投資と効果の基準  - 今後
: AI疲れ・レビュー負荷にどう立ち向かうか 

生成AI活用のROI、どう測る？ DMM.com 開発責任者から学ぶ「AI効果検証のノウハウ」...

生成AI活用のROI、どう測る？ DMM.com 開発責任者から学ぶ「AI効果検証のノウハウ」 / ROI of AI

Masato Ishigaki / 石垣雅人

More Decks by Masato Ishigaki / 石垣雅人

Other Decks in Technology

Featured

Transcript

1 Masato Ishigaki  July. 19, 2025  生成AI活用のROI、どう測る？   DMM.com 開発責任者から学ぶ

2 About me  石垣雅人  合同会社 DMM.com    プラットフォーム開発本部副本部長

https://jp.findy-team.io/blog/ai-casestudy/ai_effectiveness_verification_dmm/ 話すこと  5

6 Table of Contents  - AIによって開発スタイルとスケーリングの違い  - AIへの投資と人への投資によるお金の変化  - AIエージェントへの投資対効果の投資と効果の基準

7 Table of Contents  - AIによって開発スタイルとスケーリングの違い  - AIへの投資と人への投資によるお金の変化  - AIエージェントへの投資対効果の投資と効果の基準

AIエージェントによる開発スタイルの変化  従来プロダクション現在成果物は物理的な時間と人が同期していた  ガードレール役に徹する（CodeRabbit等で短縮）プロダクション人の物理的な時間と成果物

これから人は問い型へ  プロダクション 9 AIエージェントによる開発スタイルの変化  成果物のレビューもAIへ LLM-as-a-judge

人による量のスケーリングの終わり  10 人の増やして量を作る  2 pizzaで分解する  アジャイル × マイクロサービス   人とのコミュニケーションパス

11 ちなみに  AIが人を代替するのではなく、  AIを使っている人がAIを使っていない人を代替する

人によるスケーリングから、AIによるスケーリング  + + + 人を増やして、スケール    個の生産性を上げて、スケール    個とAIを増やして、スケール

人材関連費・給与手当・賞与・法定福利費・福利厚生費・地代家賃・採用費・販管費 / 支払い手数料

14 Table of Contents  - AIによって開発スタイルとスケーリングの違い  - AIへの投資と人への投資によるお金の変化  - AIエージェントへの投資対効果の投資と効果の基準

AIエージェントへの投資対効果について - 投資対効果の「投資の部分」  - AIエージェントやFindy Team+といったチームの生産性に寄与するものコスト（人件費は除く）   - 投資対効果の「効果の部分」

投資対効果の「投資の部分」チームごとのコストツールごとのコスト AIエージェントのツールは   使わないものは削る

生産量・リードタイム・1人あたりの生産性  - 生産量 : ノイズを取り除いた状態でのPR数などの数的推移  - リードタイム : 類推見積りでおおよそ一致した施策のリードタイム比較

Findy Team+, Findy AIによる比較  ある平均的な1チームの例（3ヶ月）

Findy Team+, Findy AIによる比較  指標人間チーム Devin AI 勝者総合⽣産量

Findy Team+, Findy AIによる比較  ある平均的な1チームの例（3ヶ月）   【品質分析】  指標人間チーム Devin

Findy Team+, Findy AIによる比較  ある平均的な1チームの例（3ヶ月）   【作業内容分析】  人間チーム (189件) の作業分布

AI疲れとレビュー負荷の違い  - AI疲れ  - Devin/ Cursor background agentを非同期で動かしながら手元では同期的にAIエージェントとvibe-codingをし

25 まとめ  - AIによって開発スタイルとスケーリングの違い  - AIへの投資と人への投資によるお金の変化  - AIエージェントへの投資対効果の投資と効果の基準  - 今後