Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SRE NEXT 2024 スライドみただけの感想 / Just a quick look a...
Search
kyonmm
PRO
August 19, 2024
Technology
2
510
SRE NEXT 2024 スライドみただけの感想 / Just a quick look at the slides for SRE NEXT 2024
https://note.com/kyon_mm/n/n47027f0c270b
にて話している様子も公開しています
kyonmm
PRO
August 19, 2024
Tweet
Share
More Decks by kyonmm
See All by kyonmm
Engineering Managementのグローバルトレンド #emoasis / Engineering Management Global Trend
kyonmm
PRO
6
1.1k
フレームワークを生み出すメタフレームワークという考え方 -適応型から生成型へ- #RSGT2025 / From adaptive to generative
kyonmm
PRO
3
3.8k
Living Process #RSGT2024
kyonmm
PRO
3
2.7k
アジャイルクイズ王 2024 #RSGT2024 / agile quiz king 2024
kyonmm
PRO
0
160
プロダクトマネジメントのグローバルトレンド #pmconf2023 / Global Trends in Product Management
kyonmm
PRO
3
7.4k
スタートアップのためのアジャイルプラクティス -論文100本ノック- #xpjug / Agile Practice for Startup - Papers -
kyonmm
PRO
4
2.1k
アジャイルリーダークイズ王 2023 #scrummikawa / agile leader quiz king 2023
kyonmm
PRO
1
1.3k
アジャイルテストクイズ王2023 #scrumniigata / agile test quiz king
kyonmm
PRO
0
940
アジャイルコーチクイズ王 2023 #scrumfukuoka
kyonmm
PRO
0
2.3k
Other Decks in Technology
See All in Technology
PostgreSQL Log File Mastery: Optimizing Database Performance Through Advanced Log Analysis
shiviyer007
PRO
1
150
C++26アップデート 2025-03
faithandbrave
0
1.2k
Mastraに入門してみた ~AWS CDKを添えて~
tsukuboshi
0
380
Terraform Cloudで始めるおひとりさまOrganizationsのすゝめ
handy
2
210
Dataverseの検索列について
miyakemito
1
160
Running JavaScript within Ruby
hmsk
3
430
より良い開発者体験を実現するために~開発初心者が感じた生成AIの可能性~
masakiokuda
0
230
生成AIのユースケースをとにかく集めてまるっと学ぶ!/ all about generative ai usecases
gakumura
3
350
ドキュメント管理の理想と現実
kazuhe
3
310
AIによるコードレビューで開発体験を向上させよう!
moongift
PRO
0
290
10ヶ月かけてstyled-components v4からv5にアップデートした話
uhyo
5
450
Compose におけるパスワード自動入力とパスワード保存
tonionagauzzi
0
180
Featured
See All Featured
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
119
51k
Six Lessons from altMBA
skipperchong
28
3.7k
Faster Mobile Websites
deanohume
306
31k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
770
Automating Front-end Workflow
addyosmani
1370
200k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
BBQ
matthewcrist
88
9.6k
Rebuilding a faster, lazier Slack
samanthasiow
81
9k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.7k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
How STYLIGHT went responsive
nonsquared
100
5.5k
Transcript
SRE NEXT 2024 スライドみただけの感想 kyon_mm
2
SRE NEXT 2024はソフトウェアサービス の信頼性に関するカンファレンス • 信頼性に関するプラクティスに深い関心を持つエンジニアのた めのカンファレンスです。 同じくコミュニティベースのSRE勉 強会である「SRE Lounge」のメンバーが中心となり運営・開催
されます。 SRE NEXT 2024のテーマは「Beyond NEXT」です。 SRE NEXT 2023で掲げた価値観 Diversity、Interactivity、 Empathyを大切にしつつ、SREの担う幅広い技術領域のトピック や組織、人材育成に対してディスカッションやコミュニケー ションを通じて、新たな知見や発見を得られる場にします。 3 引用:https://sre-next.dev/2024/
公開されているスライドは28/37 ※2024/08/19時点 • ほとんどがSpeakerdeckに公開されている • SRE NEXT 2024公式サイトにはまとめる仕組みがないので、ま とめブログなどを参考になる •
公開されているスライドは全て日本語である • キーノートのスライドが見当たらなかったが、英語で話しながらスラ イドは日本語だったとXのポストが存在した 4
以降はすべてkyon_mmの判断であり、業 界標準の基準などは利用していない • 以降ではスライドを4象限に分類しながら感想をまとめた • 4象限の作り方や判断基準は定性的なもの & SREではない kyon_mmがスライドを読んだだけで判断したものである &
スラ イドの有用性の評価ではない • この感想の次のSTEPとしてはcatchpoint社が提供しているSRE Report 2021から2024くらいまでによるグローバルトレンドと コミュニティの課題感の比較からの分析をしてみたい 5
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 6 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 7 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み 1 9 13 5
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 8 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[基本的な技術 × 独立型SRE] 1/2 • カンファレンスとして必要なコンテンツを取り揃えてあるよう に思う。 • 「基本事項をおさらいしながら自社サービスや取り組み」を紹 介するというスポンサーセッションはお手本のように感じる
(運営側がほしいセッションにおもう) • FourKeys導入失敗のように陥りがちな失敗事例があるのも、社 内での理解醸成のために必要なコンテンツとして使いやすい。 9
[基本的な技術 × 独立型SRE] 2/2 • SREという話をするためにはどのような事業なのか(どういう ユーザー体験とスペックを保つように仕事をしているのか)を 話す必要があるというのは、企業のエミネンス活動としてもよ くできているコミュニティだとおもう。 •
SREの各書籍に書かれているような内容をどうやって自分たち の仕事に落とすのかがわかりやすいセッションが多かったよう におもう。 10
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 11 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[高度な技術 × 独立型SRE] • SRE系のツールでのAI活用は相性がよさそうな領域ゆえにいろ んな可能性を妄想できるスライドだった。 • 自動化できる範囲もそうだが、バディとしてのAIの活用が有用な領域 におもう。 •
SREの高度な技術というのがどうしても標準とか複数プロダク トをどう扱うか?みたいなところになりがちなので、もっと 尖った話をきいてみたいとおもう。 • Instagramは数十名で回していたよねみたいなときに必要なSREって結 構尖ったことをやっていたと思う。 12
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 13 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[基本的な技術 × 横断型SRE] 1/2 • 横断型のSREチームになる過程もふくめてセッションがとりそ ろっていていろんな人にとって聞きやすかったとおもう。 • 工学としてのSRE再訪のようなキーノートのようなセッション もあってコミュニティの分厚さを感じた。
• いわゆるデジタルSaaS企業以外のセッションだとSRE導入の難 しさみたいな話になるのは、本当にそうなんだと思うが、普通 にやっているよ?くらいのテンションのセッションがもっとあ ると全体としてよくなる気がした。 14
[基本的な技術 × 横断型SRE] 2/2 • インシデント対応の成熟度モデルのような普遍的な話を2024文 脈で整理してあるのは今後のAI活用という文脈でも重要なセッ ションにおもえた。CNCFも成熟度モデルをだしたりしているわ けだけど、どのように発展していくのか楽しみ。 •
一番セッションが多かったのもあるが、事業のいろんなフェー ズの話が混ざっていたとおもう。 15
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 16 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[高度な技術 × 統合型SRE] • 大規模なデータや事業を支えるためにある程度高度な方法につ いての解説が全体の20%くらいあったのはバランスがよかった のかもしれない?(ほんとうか?) • この規模の話をしているのにディスクレーマーが少ないスライ ドなのがコミュニティの若さをかんじてよかった
• 意外と当たり前のことだったりするんだけど、まともに全部や るんだよっていう感じなのも好感をもてるスライドがおおかっ た。 17
自分たちが向き合っている製品の数や成長度 合いによってどの知見を使うのかが分かれる 18 横断的 独立 基本的な技術 高度な技術 1つの製品で高度なスキルを実践するSRE組織 1つの製品で基本的なスキルを実践するSRE組織 複数の製品で基本的なスキルを実践するSRE組織
複数の製品で高度なスキルを実践するSRE組織
全体の感想 • 技術的な話から組織的な話まであっていろんな人が参加しやすいカンファ レンスに見える • 生成AIの話がすくなくて残念だったが、これはいま多くの組織が試行錯誤 中だということを示唆しているのか? • スライドになっていないパネルディスカッションの「SREの技術トレンド2024」で話 されたのかも?
• SREにおけるタスク管理とかチーム活動みたいなそういった部分について あんまり見れなかったのがちょっと残念だった • 働き方的なところをもう少し知りたかった • SREはいかに低コストで安全にやっていくのか?というところであまり実 験じみたことをやる人たちがいないのかもしれない?結果として、[基本X 独立]->[基本X横断]->[高度X横断]というパスがよいということか? • 世界のどこかで[高度X独立]をやっているとおもうんですが、めったにいないのかも しれない 19