クラウド利用の拡大に伴い、コストの異常増加(スパイク)を検知してから原因を特定するまでのリードタイムが、FinOps運用上の大きな課題になっています。本セッションでは、コストインシデント発生時の調査プロセスをAIエージェントによって自動化する取り組みを紹介します。具体的には、コスト異常検知をトリガーに、AIエージェントが課金データ、デプロイ履歴、インフラ変更ログ、メトリクスなど複数のデータソースを横断的に調査し、原因の仮説立案から検証までを自動で行う仕組みについて、アーキテクチャと実装上の工夫を解説します。あわせて、人間のレビューをどこに組み込むか、誤検知や誤った原因特定をどう防ぐかといった、AIエージェントを実運用に乗せる上での設計上の論点にも触れます