Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
幻滅期を越える サイトリライアビリティ エンジニアリング
Search
syossan27
February 28, 2026
210
1
Share
幻滅期を越える サイトリライアビリティ エンジニアリング
SRE Kaigi 2026 延長戦 ~ ゆるSRE勉強会もあるよ! ~の発表資料です。
syossan27
February 28, 2026
More Decks by syossan27
See All by syossan27
プロポーザル サポートガイドを読み解いていこう!
syossan27
3
690
一人SREが歩んだ Platform Engineering スモールスタート実践録
syossan27
2
1.7k
SREって何? 現場で学んだサイト信頼性の第一歩
syossan27
5
1.6k
知識0からカンファレンスやってみたらこうなった!
syossan27
5
670
突然のメモリ使用率上昇へ対応! k8sカスタムコントローラー開発事例
syossan27
2
540
監視 やばい
syossan27
12
11k
最先端を追う前に、まず広めよう! 〜AIツールの普及活動のすすめ〜
syossan27
2
1.6k
Fanstaの1年を大解剖! 一人SREはどこまでできるのか!?
syossan27
2
850
SRE Trail Mapから考える仲間の増やし方
syossan27
3
860
Featured
See All Featured
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
My Coaching Mixtape
mlcsv
0
110
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
190
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
450
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
230
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.2k
Making the Leap to Tech Lead
cromwellryan
135
9.8k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Automating Front-end Workflow
addyosmani
1370
200k
Transcript
幻滅期を越える サイトリライアビリティ エンジニアリング AIによる啓発期へのロードマップ
しょっさん @syossan27 コミュニティ活動 SRE Kaigi 実⾏委員⻑ SRE Magazine 編集⻑ ゆるSRE勉強会
共同運営 ⼀般社団法⼈ SREコネクト 代表理事 クラウドネイティブ会議 共同主催
1. 黎明期 - Technology Trigger 新技術や概念が注⽬される段階 実⽤例が少なく、将来的な価値が定まっていない 2. 過度な期待のピーク -
Peak of Inflated Expectations メディアなどに持ち上げられ、実態以上に 評価されている状態 3. 幻滅期 - Trough of Disillusionment 実践することでの難しさ、コスト感など 壁にぶつかることでの評価の冷え込み 4. 啓発期 - Slope of Enlightenment 幻滅期に実践を続けた⽅がべスプラを⾒つけ出し、 現実的な評価を周りに広める 5. ⽣産性の安定期 - Plateau of Productivity 評価が落ち着き、当たり前の技術分野として受け⼊れ られ、定着する ガートナー‧ハイプ‧サイクルにおける現在地
多くのリーダーが、真のSRE導⼊には新しい原則への深いコミットメン ト、多⼤な投資、そして根本的なカルチャーシフトが必要であるという 現実に直⾯しています。 これは、運⽤チームやその他のチームの肩書きを変えるだけでは実現で きません。 - Gartner. Senior Director, Hassan
Ennaciri つまりは「なんとなく始めてみた」けども、本当の意味でSREを実践するには多⼤な コストがかかるということに気付き始めた トイルの増⼤ catchpoint社によるSRE調査で、 25%のSREsが仕事の30%以上がト イルであると答え、前年の24%よ り悪化。 47% 信頼性問題の組織認知 信頼性について組織として取り扱 われているか?の問いに47%が否 定‧中⽴な回答。 信頼性というものが組織に受け⼊ れられていない現状。 背景にある構造的要因 先駆者の旅⽴ち 組織にSREを導⼊した先駆者が組織を去り、SREが 廃れるというパターン。 組織の変化が忌避される SREに対する投資価値などは理解され、⼀定の組み 込みは出来たが、組織として⼤きくやり⽅を変えら れていない。 継続投資への無理解 トイルの最適化や、DX改善、横断的なSREの実践 など⻑期的な⽬線で取り組まなければいけない が、そこまで投資をかける価値がないと判断されて しまう。 様々な現実と壁 何故、幻滅期に⼊ったか? 30%
AIへの期待 インシデント時など⼈間の判断を⽀援 トイルの最適化スピードの増幅 ドキュメント メンテナンスコストの低減 考えうる課題 実装スピードの加速による信頼性の低下 AIツールの整備コスト 機能拡⼤によるトイルの増加 AIは"啓発期"へのカンフル剤になり得るか?
→ AI × SREでどこまで課題に⽴ち向かえるか?がポイント
Case 02 SREIPS(SRE Intelligent Problem Solver)によるイベント駆動型インシデント管理 課題 複雑なK8sイベントが連鎖し、 根本原因(RCA)の特定に数時 間を要していた。
分析 (RAG) 過去数年分のポストモーテムを 参照し、類似障害と照合。 結果 分析時間を⼤幅に圧縮。複雑な 障害の根本原因分析を短時間で 完了。 成果 MTTR(平均修復時間)が劇的 に改善。運⽤チームの認知負荷 を最⼩化。 AI × SREのモデルケース Case 01 AIによるクラウドリソースコスト最適化 課題‧検知 Optimizeエージェントが、夜 間や週末にリソース使⽤率が 数%未満の開発環境VM群を⾃ 動検知。 分析‧推奨 使⽤パターンを分析し、「未 使⽤リソースの⾃動停⽌」と 「サイズ縮⼩」を推奨。最適化 スクリプトを⾃動⽣成。 実⾏ 承認後、スクリプトを⾃動実⾏ し、対象VMのサイズ変更とス ケジュール停⽌設定を適⽤。 成果 ⽉額クラウドコストを⼤幅に 減らし、無駄な⽀出を即座に カット。
トイルコストの最適化 組織におけるトイルによるコストをAIで削減。 機能拡⼤によるトイルの増加という⾯もあるが、解決ス ピードをどれだけ早めるかが鍵となる。 知識の構造化 ランブックやポストモーテムを、AIがクエリ可能なベクト ル形式へ変換。暗黙知を「使える形式知」にする。 これにより、チャットボットによる知識へのアクセスや、 AIのインシデントレスポンス精度を上げる。 予防的運⽤への転換
Amazon DevOps Guruのような、事後対応(リアクティ ブ)から予兆検知(プロアクティブ)への転換により、ダ ウンタイム損失とインシデント対応コストを低減。 SREの価値を組織に証明 ビジネスKPIとSREメトリクスを連携し、AIが経営層向けの 信頼性レポーティングを⾃動⽣成。「幻滅期」の誤解を解 消し、SREの価値を証明する。 幻滅期における組織のコスト問題をAIで緩和し、啓発期にいけるといいね! 幻滅期を脱する:AI × SREによるコスト最適化