Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS DevOps Agentで見えた運用の未来 / The Future of Oper...
Search
yayoi_dd
February 26, 2026
Technology
24
0
Share
AWS DevOps Agentで見えた運用の未来 / The Future of Operations with AWS DevOps Agent
弥生株式会社 もくテク
AWS re:Invent 2025 参加報告会(2026/02/26)
https://mokuteku.connpass.com/event/383715/
yayoi_dd
February 26, 2026
More Decks by yayoi_dd
See All by yayoi_dd
AWS re:Invent 2025 参加報告 / AWS re:Invent 2025 Participation Report
yayoi_dd
0
24
re:Inventの学びを最大化するためにしたこと / What I Did to Maximize Learning at re:Invent
yayoi_dd
0
24
Werner Vogelsが語った”T型人材” / "T-Shaped Talent" as Discussed by Werner Vogels
yayoi_dd
0
23
AI駆動開発のさらにその先へ / Beyond AI-Driven Development
yayoi_dd
0
28
OpenSearch Warm Tier設計の実践 / Practical Implementation of OpenSearch Warm Tier Design
yayoi_dd
0
48
なぜ私たちは「生成AI-LT大会」を終了するのか / Why we are ending the Generative AI-LT competition
yayoi_dd
0
74
AIと働く / Working with AI
yayoi_dd
0
83
AIで未経験タスクの心理的ハードルが下がった話 / How AI has lowered the psychological barrier to unfamiliar tasks
yayoi_dd
0
52
品質くん~電話応対品質をAIで診断してる件~ / Quality-kun: Using AI to assess telephone response quality
yayoi_dd
0
55
Other Decks in Technology
See All in Technology
エンジニアは生成AIと どのように向き合うべきか? ことばの意味という観点から
verypluming
3
290
「使われるデータ基盤」を目指してデータアナリストとワークショップをやった話
jackojacko_
2
920
GitHub Copilot CLI の Rubber Duck 機能を使ってコーディングの品質をあげよう #techbaton_findy
stefafafan
2
1.2k
Dynamic Workersについて
yusukebe
1
370
テストコードのないプロジェクトにテストを根付かせる
tttol
0
220
AI時代に改めて考える、ドメイン駆動設計 - モデリングが「AIへの共通言語」になる
littlehands
8
2.8k
20260528_生成AIを専属DSに_Howの次にすべきことを考える
doradora09
PRO
0
250
JJUG CCC 2026 Spring AI時代の開発こそ標準化を武器に! ― 方式・プロセス・プラットフォームの標準化
s27watanabe
2
600
AI時代から振り返るTerraform drift運用の歴史 / AI Age Reflections on the History of Terraform Drift Operations
aeonpeople
0
570
Spring AI × MCP 入門〜AIエージェントへのツール公開、境界設計から始める最小構成 〜
yuyamiyamoto
0
170
Sony_KMP_Journey_KotlinConf2026
sony
0
160
JICUG あなたのAI駆動開発パートナー IBM Bob を使ったアプリ開発
1ftseabass
PRO
0
120
Featured
See All Featured
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
RailsConf 2023
tenderlove
30
1.4k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
130
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.5k
GraphQLとの向き合い方2022年版
quramy
50
15k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
44k
Ruling the World: When Life Gets Gamed
codingconduct
0
240
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
560
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
350
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.8k
Transcript
弥生株式会社 NEXT BUクラウドプロダクト開発部 米川 桂 弥生株式会社 NEXT BUクラウドプロダクト開発部 米川 桂
弥生株式会社 / 米川 桂(よねかわ けい) 法人向け/個人事業主向けの会計ソフトの開発 C#/.NET/Azure/AWS re:Invent 2025に初現地参加 休日の過ごし方:テニス、子供と遊ぶ
None
アラーム疲れ: アラームのたびに一時的に開発 を止めて調査にあたるため、集中が削がれる 調査のボトルネック: アプリか?インフラか? あらゆるログを横断して調査 「AIが代わりに調べてくれたら⋯」 対応の遅れ: ユーザーへの問い合わせ対応、シ ステムの復旧までに遅れが生じる
None
自律的な原因分析と改善提案 経験豊富なDevOps エンジニアのように、リソース の関係性、オブザーバビリティツール、GitHubリ ポジトリ、CI/CD パイプラインから、テレメトリデ ータとコードを相互に関連付けて、インシデントの 根本原因分析や改善提案を自律的に行う。
「Agent Space」と呼ばれるワークスペースを作成 管理者向け 運用チーム向け マネジメントコンソールで「Agent Space」の作成、権 限付与、GitHub・NewRelic・Datadog等のサードパー ティ連携を設定を行う。 Agent Spaceを作成したら、専用のWebアプリが払い出
される。運用チームはこちらで日々のインシデントの 調査・対応を行う Agent Spaceとは: 「誰が(利用者)」「どの範囲(AWSアカウント・リソース)」を操作・調査できるかを定義する、安全な隔離環境 管理機能と日常の運用業務を分離するデュアルコンソールアーキテクチャを採用
プロンプト例: “Investigate the latest triggered CloudWatch alarm in ap-northeast- 1
for AWS account XXX. Analyze the underlying metrics and logs to identify the root cause.” AWSアカウント XXX の東京リージョンで発生した最新の CloudWatch ア ラームを調査し、関連するメトリクスとログを分析して根本原因を特定せ よ
None
アプリケーション: Lambda (コンテナイメージ) + DynamoDB CI/CDデプロイ: GitHub Actions で自動デプロイ 監視・アラーム通知:
CloudWatch Alarm + SNS + Q Developer (Chatbot) Slack連携
シナリオ: 仕様変更が入ったと仮定し、KeyError が発生するLambdaコードをデプロイ。リクエスト パラメータを変更せずに実行エラーを発生させ、アラーム状態に。
以前の正常なコンテナイメージのバー ジョンへのロールバックを具体的に提 案 「直前のデプロイがトリガーだと特定」 ・デプロイ履歴とエラー発生時間を照合 ・「直前の変更」が原因であることを突き 止めた ・調査時間は10分ほど
シナリオ: LambdaからDynamoDB への権限を剥奪 「AccessDenied を即座に検知・分析」 ・DynamoDBへの書き込み権限がないこと を正確に指摘 ・不足しているアクション( dynamodb:PutItem)を特定 ・修正用のIAMポリシー案まで提示
・調査時間は5分ほど
シナリオ: Lambdaのタイムアウトエラー シナリオ: DynamoDBスロットリングエラー 「設定値と実行実態の乖離を指摘」 ・マネコンからのタイムアウト設定 変更を検知 ・「現在のコードは完了までに3秒以 上必要」と分析 ・タイムアウト値を3秒以上に延⾧す
べき」と具体的な設定値を提案 ・調査時間は5分ほど 「キャパシティ不足をピンポイント に特定」 ・ログからスロットリングエラーの 発生を検知 ・書き込み容量(WCU)が「1」で 大幅に不足していると断定 ・調査時間は5分ほど
CloudWatchのアラームとDevOps Agentの調査結果を セットで通知することで、アラーム通知から原因究明 までシームレスな運用ができるのではと実感
リージョン制限: 現在はバージニア北部のみ。ターゲットのリソースは他リージョンでもOK 言語は英語のみ: プロンプトや出力は今のところすべて英語。ただし、翻訳ツールで十分実用レベル。 利用上限(月間クォータ): 調査20時間 / 予防分析10時間 / チャット1,000メッセージ
自動化は作り込みが必要: アラーム発報からの自動調査は標準機能としてはまだなく、CloudWatchアラームから Lambdaを経由してWebhookを叩く仕組みの構築が必要。 AgentSpace作成: 最大10個 同時実行数: インシデント解決調査タスク3つまで。インシデント予防評価タスクの数は1つまで 価格: プレビュー期間中は無料。※調査過程で実行されるAPI呼び出しやクエリには料金が発生
AIによる自律的な調査の実現 ログ解析やリソース確認をAIが自律的に実行し、人間が「何が起きたか」を探す時間はなく なるのでは MTTR(平均復旧時間)の大幅な短縮 原因特定だけでなく、具体的な修正案まで提示してくれるので、MTTR(平均復旧時間)の 大幅な短縮に繋がると実感 人間の役割の変化 監視から修復までがシームレスに繋がることで、人間は調査結果を確認し、影響範囲の把握 や「意思決定」に専念できる