Upgrade to Pro — share decks privately, control downloads, hide ads and more …

イオンスマートテクノロジーの「SRE×AI」実践録​ -インシデントからIaC、可観測性まで...

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for AEON AEON
June 09, 2026

イオンスマートテクノロジーの「SRE×AI」実践録​ -インシデントからIaC、可観測性まで-/Aeon Smart Technology’s SRE × AI in Practice

2026/06/09に行われた「EnterpriseZine Day 2026 Summer​」トラック4-Bの資料です。

- イベントURL: https://event.shoeisha.jp/ezday/20260609
- セッションURL: https://event.shoeisha.jp/ezday/20260609/session/6799

Avatar for AEON

AEON

June 09, 2026

More Decks by AEON

Other Decks in Technology

Transcript

  1. 自己紹介 もりはや aka 林 如弥(X:@morihaya55) イオンスマートテクノロジー株式会社(AST) Developer Enablement Div. SREユニット所属

    (2024/3入社) 趣味:Podcast鑑賞・映画鑑賞・読書・ジョギング ・F1観戦 おすすめのPodcast 「COTENラジオ」 おすすめの書籍 「数理思考モデルで紐解く RULE DESIGN」 おすすめの映画 「RRR」 2
  2. 「SRE」の領域は広いですが、本日は以下の3つ! • IaCによるクラウドリソース管理 × AI • 可観測性・パフォーマンス分析 × AI •

    インシデント対応 × AI o +それらを支える「AI利用スキル」 7 本日のテーマ「SRE x AI」と、3本柱
  3. • なぜ「SRE x AI」なのか • IaC × AI:HCP Terraformと検証環境全削除からの復旧 •

    可観測性 × AI:New Relicと「AI窓口」 • インシデント対応 × AI:各社SRE Agentを備えている • 実践ノウハウ:SREのためのAI利用スキル • これからの展望、まとめ 8 アジェンダ
  4. なぜ「SRE x AI」なのか - 膨大なログ・メトリクスから、必要な情報を引き出 すのは重い作業(grep, awk, nQL, Script, etc..)

    - 複雑化するIaCコードを、正しく読み解き扱うのも 難しい(module, drift, workspace, state) その難しさに、AIが実践レベルで効き始めている。 12 SREの難しさに、AIをどう効かせるか
  5. IaC × AI:HCP Terraformと検証環境全削除からの復旧 - 主要Azure環境の9割以上をTerraformでIaC管理し ている - SaaS(New Relic,

    PagerDuty)の一部機能もIaC管 理対象としている - 日々発生する更新や、差分(terraform drift)への対応 にはAIによるコード生成・レビューは最早必須 15 通常運用でのIaC x AI活用
  6. IaC × AI:HCP Terraformと検証環境全削除からの復旧 - 手動復旧したリソース=IaCで作成していないため、 IaC側への取り込みが必要 - 取り込みはTerraform importと呼ばれる中級者でも

    大変な作業 - それらを手動復旧した数百リソースへ行うのは膨大 な量で従来なら1日以上掛かりかねない 17 手動で直したものはImportするか除外が必要
  7. IaC × AI:HCP Terraformと検証環境全削除からの復旧 - 一部のIaC未管理の領域に対して、一括実行のシェ ルスクリプトを作成 - 復旧後、IaCツールが持つ削除前のTerraform State

    (状態ファイル)と、MCPを利用して細かなパラ メータまで削除前と一致するかの実環境の状態レ ビュー 19 コード修正以外にもAIの効果は大きかった
  8. 可観測性 × AI:New Relicと「AI窓口」 • APM • メトリクス • ログ

    • トレース • アラート/SLO 22 New Relicはデータの宝庫
  9. 可観測性 × AI:New Relicと「AI窓口」 • 「だっしゅぼーどを眺める会」の定期実施 • New Relicさん支援で社内勉強会の開催 •

    社内ドキュメントの整備・展開 • SSOによる簡単にログインできる環境 • 社用スマホでの利用を可能に 24 New Relic普及の取り組みは行ってきた
  10. 可観測性 × AI:New Relicと「AI窓口」 26 事前準備した情報以外への壁がある 先月リリースしたAPI について、1時間ごと の平均のレスポンスタ イムを知りたい

    SELECT average(properties.timeTaken) * 1000 AS 'avg_response_ms' FROM Log WHERE resourceId LIKE '%hogehoge%' AND properties.httpMethod = 'GET' AND properties.originalRequestUriWithArgs LIKE '/api/fuga/piyo%' SINCE 1 WEEK AGO TIMESERIES 1 hour LIMIT MAX
  11. 可観測性 × AI:New Relicと「AI窓口」 • 単にNew Relicを利用するだけのツールではなく、 システム構成や組織用語などのドメイン知識をプ ロンプトとしてセット •

    GitHub(ソースコード)、Jira/Confluence(チ ケット、ドキュメント)など他ツールのMCPも実 装し手広い窓口としても機能している 29 AI窓口としての工夫
  12. インシデント対応 × AI:各社SRE Agentを備えている • 「SRE Agent」の役割を持つ機能を各社が提供し ている時代になった(うれしい悲鳴) • 当社が扱うクラウド・SaaSにおいては以下

    o Azure SRE Agent:クラウド o New Relic SRE Agent: 可観測性 o PagerDuty SRE Agent: インシデント管理 34 ベストで、最高のSRE Agentはどれ?
  13. インシデント対応 × AI:各社SRE Agentを備えている • Azure SRE Agent:クラウド o クラウドの中で調査・思考・対応実行までを行う

    • New Relic SRE Agent: 可観測性 o 保持しているアプリからインフラまでのデータを一気 通貫で活用して調査 • PagerDuty SRE Agent: インシデント管理 o 障害対応時のメンバーのように振る舞い、過去のナ レッジや情報の整理、対応案の提示などを行う 35 名前は同じでも強みと用途が異なる
  14. インシデント対応 × AI:各社SRE Agentを備えている • いずれも可能性は感じつつも、全面的な採用は 現状では難しい感触 • 検証段階としながら小規模に試していくフェー ズと捉えている

    • また、それぞれのAgentがそれぞれのMCPを活 用できるため、可能性は広がり続けている • A2AプロトコルのようにAgent同士が直接やり とりする未来も期待できる 36 強みも違うし、変化が激しい中で正解はない?
  15. 実践ノウハウ:SREのためのAI利用スキル • AI料金はトークン従量課金へ料金体系が変更 • Instruction, Skill, Sub agentなどを使い分ける • AIモデルの適切な選択

    • ファイル、プロンプトの渡し方なども工夫が必 要になっていく 以降はいくつかの具体例を提示します。 39 「使ってみた」から、「使いこなす」フェーズへ
  16. 実践ノウハウ:SREのためのAI利用スキル 51 ログフォレンジックでの活用 - 4 IaCでも説明した以下を用意しておくと便利 - Custom instructions: ログの名前とサービスの関係

    を紐づける。ログの形式なども記載する(UTCなど - Skills: 社内に報告したい、いつもの報告書形式で作 成するSkillなどを作成
  17. これからの展望、まとめ 55 まとめ - 「SRE x AI」AI機能の充実によって従来のSRE業務 でも活用が可能になっている - ただし進化が早くフルベットしようにも半年先が予

    想できない状況 - トライを続け、ナレッジのシェアしながらシステム を最適化し、サービスを通して顧客価値へ!!
  18. テックブログ Meetup SNS オウンドメディア 1 2 3 4 会社紹介:いろいろやっています!! イオングループのエンジニ

    アたちにより、 Zennの Publicationで運用されてい るテックブログ 毎月オンライン or オフライ ンで実施されているAEON主 催のテック系イベント AEON TECH HUB関連の活 動についての情報をポスト していきます AEONグループの社員インタ ビューや登壇レポート、イ ベントのお知らせなどの 様々な記事をお届けします