Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS DevOps Agentで見えた運用の未来 / The Future of Oper...
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
yayoi_dd
February 26, 2026
Technology
24
0
Share
AWS DevOps Agentで見えた運用の未来 / The Future of Operations with AWS DevOps Agent
弥生株式会社 もくテク
AWS re:Invent 2025 参加報告会(2026/02/26)
https://mokuteku.connpass.com/event/383715/
yayoi_dd
February 26, 2026
More Decks by yayoi_dd
See All by yayoi_dd
AWS re:Invent 2025 参加報告 / AWS re:Invent 2025 Participation Report
yayoi_dd
0
24
re:Inventの学びを最大化するためにしたこと / What I Did to Maximize Learning at re:Invent
yayoi_dd
0
24
Werner Vogelsが語った”T型人材” / "T-Shaped Talent" as Discussed by Werner Vogels
yayoi_dd
0
23
AI駆動開発のさらにその先へ / Beyond AI-Driven Development
yayoi_dd
0
28
OpenSearch Warm Tier設計の実践 / Practical Implementation of OpenSearch Warm Tier Design
yayoi_dd
0
48
なぜ私たちは「生成AI-LT大会」を終了するのか / Why we are ending the Generative AI-LT competition
yayoi_dd
0
74
AIと働く / Working with AI
yayoi_dd
0
83
AIで未経験タスクの心理的ハードルが下がった話 / How AI has lowered the psychological barrier to unfamiliar tasks
yayoi_dd
0
52
品質くん~電話応対品質をAIで診断してる件~ / Quality-kun: Using AI to assess telephone response quality
yayoi_dd
0
55
Other Decks in Technology
See All in Technology
ビジュアルプログラミングIoTLT vol.23
1ftseabass
PRO
0
150
APIテストとは?
nagix
0
140
食べログのサーキットブレーカー導入を振り返って
atpons
1
150
Agentic AI時代における メルカリのAIガバナンスとガードレール実装
naoichihara
16
17k
個人AIからチームAIへ:開発における品質と生産性の再設計
moongift
PRO
0
290
エンジニアは生成AIと どのように向き合うべきか? ことばの意味という観点から
verypluming
3
290
テストコードのないプロジェクトにテストを根付かせる
tttol
0
220
Datadog 認定試験の概要と対策
uechishingo
0
160
AIが変えた"品質の守り方"
kkakizaki
13
5.2k
速さだけじゃない! VoidZero ツールが移行先に選ばれる理由
mizdra
PRO
6
640
AI時代の私の技術インプットとアウトプット術
tonkotsuboy_com
15
7.6k
大学生が本気でDatabricksを活用してDiscordサークルをデータ駆動させてみた
phantomjuju
1
270
Featured
See All Featured
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
170
Facilitating Awesome Meetings
lara
57
6.9k
Practical Orchestrator
shlominoach
191
11k
The SEO Collaboration Effect
kristinabergwall1
1
460
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.5k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
Transcript
弥生株式会社 NEXT BUクラウドプロダクト開発部 米川 桂 弥生株式会社 NEXT BUクラウドプロダクト開発部 米川 桂
弥生株式会社 / 米川 桂(よねかわ けい) 法人向け/個人事業主向けの会計ソフトの開発 C#/.NET/Azure/AWS re:Invent 2025に初現地参加 休日の過ごし方:テニス、子供と遊ぶ
None
アラーム疲れ: アラームのたびに一時的に開発 を止めて調査にあたるため、集中が削がれる 調査のボトルネック: アプリか?インフラか? あらゆるログを横断して調査 「AIが代わりに調べてくれたら⋯」 対応の遅れ: ユーザーへの問い合わせ対応、シ ステムの復旧までに遅れが生じる
None
自律的な原因分析と改善提案 経験豊富なDevOps エンジニアのように、リソース の関係性、オブザーバビリティツール、GitHubリ ポジトリ、CI/CD パイプラインから、テレメトリデ ータとコードを相互に関連付けて、インシデントの 根本原因分析や改善提案を自律的に行う。
「Agent Space」と呼ばれるワークスペースを作成 管理者向け 運用チーム向け マネジメントコンソールで「Agent Space」の作成、権 限付与、GitHub・NewRelic・Datadog等のサードパー ティ連携を設定を行う。 Agent Spaceを作成したら、専用のWebアプリが払い出
される。運用チームはこちらで日々のインシデントの 調査・対応を行う Agent Spaceとは: 「誰が(利用者)」「どの範囲(AWSアカウント・リソース)」を操作・調査できるかを定義する、安全な隔離環境 管理機能と日常の運用業務を分離するデュアルコンソールアーキテクチャを採用
プロンプト例: “Investigate the latest triggered CloudWatch alarm in ap-northeast- 1
for AWS account XXX. Analyze the underlying metrics and logs to identify the root cause.” AWSアカウント XXX の東京リージョンで発生した最新の CloudWatch ア ラームを調査し、関連するメトリクスとログを分析して根本原因を特定せ よ
None
アプリケーション: Lambda (コンテナイメージ) + DynamoDB CI/CDデプロイ: GitHub Actions で自動デプロイ 監視・アラーム通知:
CloudWatch Alarm + SNS + Q Developer (Chatbot) Slack連携
シナリオ: 仕様変更が入ったと仮定し、KeyError が発生するLambdaコードをデプロイ。リクエスト パラメータを変更せずに実行エラーを発生させ、アラーム状態に。
以前の正常なコンテナイメージのバー ジョンへのロールバックを具体的に提 案 「直前のデプロイがトリガーだと特定」 ・デプロイ履歴とエラー発生時間を照合 ・「直前の変更」が原因であることを突き 止めた ・調査時間は10分ほど
シナリオ: LambdaからDynamoDB への権限を剥奪 「AccessDenied を即座に検知・分析」 ・DynamoDBへの書き込み権限がないこと を正確に指摘 ・不足しているアクション( dynamodb:PutItem)を特定 ・修正用のIAMポリシー案まで提示
・調査時間は5分ほど
シナリオ: Lambdaのタイムアウトエラー シナリオ: DynamoDBスロットリングエラー 「設定値と実行実態の乖離を指摘」 ・マネコンからのタイムアウト設定 変更を検知 ・「現在のコードは完了までに3秒以 上必要」と分析 ・タイムアウト値を3秒以上に延⾧す
べき」と具体的な設定値を提案 ・調査時間は5分ほど 「キャパシティ不足をピンポイント に特定」 ・ログからスロットリングエラーの 発生を検知 ・書き込み容量(WCU)が「1」で 大幅に不足していると断定 ・調査時間は5分ほど
CloudWatchのアラームとDevOps Agentの調査結果を セットで通知することで、アラーム通知から原因究明 までシームレスな運用ができるのではと実感
リージョン制限: 現在はバージニア北部のみ。ターゲットのリソースは他リージョンでもOK 言語は英語のみ: プロンプトや出力は今のところすべて英語。ただし、翻訳ツールで十分実用レベル。 利用上限(月間クォータ): 調査20時間 / 予防分析10時間 / チャット1,000メッセージ
自動化は作り込みが必要: アラーム発報からの自動調査は標準機能としてはまだなく、CloudWatchアラームから Lambdaを経由してWebhookを叩く仕組みの構築が必要。 AgentSpace作成: 最大10個 同時実行数: インシデント解決調査タスク3つまで。インシデント予防評価タスクの数は1つまで 価格: プレビュー期間中は無料。※調査過程で実行されるAPI呼び出しやクエリには料金が発生
AIによる自律的な調査の実現 ログ解析やリソース確認をAIが自律的に実行し、人間が「何が起きたか」を探す時間はなく なるのでは MTTR(平均復旧時間)の大幅な短縮 原因特定だけでなく、具体的な修正案まで提示してくれるので、MTTR(平均復旧時間)の 大幅な短縮に繋がると実感 人間の役割の変化 監視から修復までがシームレスに繋がることで、人間は調査結果を確認し、影響範囲の把握 や「意思決定」に専念できる