Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SRE NEXT 2024 スライドみただけの感想 / Just a quick look a...
Search
kyonmm
PRO
August 19, 2024
Technology
2
670
SRE NEXT 2024 スライドみただけの感想 / Just a quick look at the slides for SRE NEXT 2024
https://note.com/kyon_mm/n/n47027f0c270b
にて話している様子も公開しています
kyonmm
PRO
August 19, 2024
Tweet
Share
More Decks by kyonmm
See All by kyonmm
品質を経営にどう語るか #jassttokyo / Communicating the Strategic Value of Quality to Executive Leadership
kyonmm
PRO
3
1.2k
RALGO : AIを組織に組み込む方法 -アルゴリズム中心組織設計- #RSGT2026 / RALGO: How to Integrate AI into an Organization – Algorithm-Centric Organizational Design
kyonmm
PRO
5
2.8k
AIのグローバルトレンド2025 #scrummikawa / global ai trend
kyonmm
PRO
1
590
IT子会社のグローバルトレンド #scrumsendai / Global Trends in IT Subsidiaries
kyonmm
PRO
3
1.5k
AIのグローバルトレンド 2025 / ai global trend 2025
kyonmm
PRO
1
300
AI時代における変革の入口-100年後も語られる25年のために- #scrumosaka / The entry point to transformation in the AI era For 25 years that will be talked about 100 years from now
kyonmm
PRO
6
2.1k
地方中小企業のエンジニアから大企業の執行役員になるまで #phpcon_niigata / road to executive
kyonmm
PRO
7
15k
ソフトウェアテストのグローバルトレンド 2025 #scrumniigata / software-test global trend 2025
kyonmm
PRO
10
9k
Engineering Managementのグローバルトレンド #emoasis / Engineering Management Global Trend
kyonmm
PRO
6
1.4k
Other Decks in Technology
See All in Technology
FastMCP OAuth Proxy with Cognito
hironobuiga
3
150
PostgreSQL 18のNOT ENFORCEDな制約とDEFERRABLEの関係
yahonda
0
100
ReactのdangerouslySetInnerHTMLは“dangerously”だから危険 / Security.any #09 卒業したいセキュリティLT
flatt_security
0
470
契約書からの情報抽出を行うLLMのスループットを、バッチ処理を用いて最大40%改善した話
sansantech
PRO
1
140
Windows ファイル共有(SMB)を再確認する
murachiakira
PRO
0
240
AlloyDB 奮闘記
hatappi
0
200
スピンアウト講座05_実践活用事例
overflowinc
0
1k
visionOS 開発向けの MCP / Skills をつくり続けることで XR の探究と学習を最大化
karad
1
1.2k
モジュラモノリス導入から4年間の総括:アーキテクチャと組織の相互作用について / Architecture and Organizational Interaction
nazonohito51
3
1.6k
AgentCoreとLINEを使った飲食店おすすめアプリを作ってみた
yakumo
2
200
脳が溶けた話 / Melted Brain
keisuke69
1
820
中央集権型を脱却した話 分散型をやめて、連邦型にたどり着くまで
sansantech
PRO
1
270
Featured
See All Featured
Un-Boring Meetings
codingconduct
0
230
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.2k
エンジニアに許された特別な時間の終わり
watany
106
240k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
Accessibility Awareness
sabderemane
0
84
Making Projects Easy
brettharned
120
6.6k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
990
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
300
Ruling the World: When Life Gets Gamed
codingconduct
0
180
Information Architects: The Missing Link in Design Systems
soysaucechin
0
840
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
68
38k
Odyssey Design
rkendrick25
PRO
2
550
Transcript
SRE NEXT 2024 スライドみただけの感想 kyon_mm
2
SRE NEXT 2024はソフトウェアサービス の信頼性に関するカンファレンス • 信頼性に関するプラクティスに深い関心を持つエンジニアのた めのカンファレンスです。 同じくコミュニティベースのSRE勉 強会である「SRE Lounge」のメンバーが中心となり運営・開催
されます。 SRE NEXT 2024のテーマは「Beyond NEXT」です。 SRE NEXT 2023で掲げた価値観 Diversity、Interactivity、 Empathyを大切にしつつ、SREの担う幅広い技術領域のトピック や組織、人材育成に対してディスカッションやコミュニケー ションを通じて、新たな知見や発見を得られる場にします。 3 引用:https://sre-next.dev/2024/
公開されているスライドは28/37 ※2024/08/19時点 • ほとんどがSpeakerdeckに公開されている • SRE NEXT 2024公式サイトにはまとめる仕組みがないので、ま とめブログなどを参考になる •
公開されているスライドは全て日本語である • キーノートのスライドが見当たらなかったが、英語で話しながらスラ イドは日本語だったとXのポストが存在した 4
以降はすべてkyon_mmの判断であり、業 界標準の基準などは利用していない • 以降ではスライドを4象限に分類しながら感想をまとめた • 4象限の作り方や判断基準は定性的なもの & SREではない kyon_mmがスライドを読んだだけで判断したものである &
スラ イドの有用性の評価ではない • この感想の次のSTEPとしてはcatchpoint社が提供しているSRE Report 2021から2024くらいまでによるグローバルトレンドと コミュニティの課題感の比較からの分析をしてみたい 5
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 6 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 7 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み 1 9 13 5
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 8 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[基本的な技術 × 独立型SRE] 1/2 • カンファレンスとして必要なコンテンツを取り揃えてあるよう に思う。 • 「基本事項をおさらいしながら自社サービスや取り組み」を紹 介するというスポンサーセッションはお手本のように感じる
(運営側がほしいセッションにおもう) • FourKeys導入失敗のように陥りがちな失敗事例があるのも、社 内での理解醸成のために必要なコンテンツとして使いやすい。 9
[基本的な技術 × 独立型SRE] 2/2 • SREという話をするためにはどのような事業なのか(どういう ユーザー体験とスペックを保つように仕事をしているのか)を 話す必要があるというのは、企業のエミネンス活動としてもよ くできているコミュニティだとおもう。 •
SREの各書籍に書かれているような内容をどうやって自分たち の仕事に落とすのかがわかりやすいセッションが多かったよう におもう。 10
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 11 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[高度な技術 × 独立型SRE] • SRE系のツールでのAI活用は相性がよさそうな領域ゆえにいろ んな可能性を妄想できるスライドだった。 • 自動化できる範囲もそうだが、バディとしてのAIの活用が有用な領域 におもう。 •
SREの高度な技術というのがどうしても標準とか複数プロダク トをどう扱うか?みたいなところになりがちなので、もっと 尖った話をきいてみたいとおもう。 • Instagramは数十名で回していたよねみたいなときに必要なSREって結 構尖ったことをやっていたと思う。 12
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 13 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[基本的な技術 × 横断型SRE] 1/2 • 横断型のSREチームになる過程もふくめてセッションがとりそ ろっていていろんな人にとって聞きやすかったとおもう。 • 工学としてのSRE再訪のようなキーノートのようなセッション もあってコミュニティの分厚さを感じた。
• いわゆるデジタルSaaS企業以外のセッションだとSRE導入の難 しさみたいな話になるのは、本当にそうなんだと思うが、普通 にやっているよ?くらいのテンションのセッションがもっとあ ると全体としてよくなる気がした。 14
[基本的な技術 × 横断型SRE] 2/2 • インシデント対応の成熟度モデルのような普遍的な話を2024文 脈で整理してあるのは今後のAI活用という文脈でも重要なセッ ションにおもえた。CNCFも成熟度モデルをだしたりしているわ けだけど、どのように発展していくのか楽しみ。 •
一番セッションが多かったのもあるが、事業のいろんなフェー ズの話が混ざっていたとおもう。 15
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 16 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[高度な技術 × 統合型SRE] • 大規模なデータや事業を支えるためにある程度高度な方法につ いての解説が全体の20%くらいあったのはバランスがよかった のかもしれない?(ほんとうか?) • この規模の話をしているのにディスクレーマーが少ないスライ ドなのがコミュニティの若さをかんじてよかった
• 意外と当たり前のことだったりするんだけど、まともに全部や るんだよっていう感じなのも好感をもてるスライドがおおかっ た。 17
自分たちが向き合っている製品の数や成長度 合いによってどの知見を使うのかが分かれる 18 横断的 独立 基本的な技術 高度な技術 1つの製品で高度なスキルを実践するSRE組織 1つの製品で基本的なスキルを実践するSRE組織 複数の製品で基本的なスキルを実践するSRE組織
複数の製品で高度なスキルを実践するSRE組織
全体の感想 • 技術的な話から組織的な話まであっていろんな人が参加しやすいカンファ レンスに見える • 生成AIの話がすくなくて残念だったが、これはいま多くの組織が試行錯誤 中だということを示唆しているのか? • スライドになっていないパネルディスカッションの「SREの技術トレンド2024」で話 されたのかも?
• SREにおけるタスク管理とかチーム活動みたいなそういった部分について あんまり見れなかったのがちょっと残念だった • 働き方的なところをもう少し知りたかった • SREはいかに低コストで安全にやっていくのか?というところであまり実 験じみたことをやる人たちがいないのかもしれない?結果として、[基本X 独立]->[基本X横断]->[高度X横断]というパスがよいということか? • 世界のどこかで[高度X独立]をやっているとおもうんですが、めったにいないのかも しれない 19