Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
あなたの興味は信頼性?それとも生産性? SREとしてのキャリアに悩むみなさまに伝えたい選択肢
Search
Kazuto Kusama
January 27, 2025
Technology
12k
8
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
あなたの興味は信頼性?それとも生産性? SREとしてのキャリアに悩むみなさまに伝えたい選択肢
SRE Kaigi 2025で発表した資料です
Kazuto Kusama
January 27, 2025
More Decks by Kazuto Kusama
See All by Kazuto Kusama
自宅LLMの話
jacopen
1
580
プラットフォームエンジニアリングはAI時代の開発者をどう救うのか
jacopen
9
5.3k
OpenClawで回す組織運営
jacopen
3
1.2k
SREの仕事を自動化する際にやっておきたい5つのポイント
jacopen
6
1.6k
AI時代のインシデント対応 〜時代を切り抜ける、組織アーキテクチャ〜
jacopen
4
400
AI時代の開発とPlatform Engineeringについて考える
jacopen
0
240
AI によってシステム障害が増える!? ~AI エージェント時代だからこそ必要な、インシデントとの向き合い方~
jacopen
4
410
インシデント対応に必要となるAIの利用パターンとPagerDutyの関係
jacopen
0
420
今日からはじめるプラットフォームエンジニアリング
jacopen
8
5.1k
Other Decks in Technology
See All in Technology
AIエージェントが名古屋の猛暑からあなたを守る
happysamurai294
0
120
手塩にかけりゃいいってもんじゃない
ming_ayami
0
570
AI駆動開発を通して感じた、 AI時代のデザイナーの役割変化
whisaiyo
3
2.1k
RSA暗号を手計算したくなること、ありますよね?? (20260615_orestudy6_rsa)
thousanda
0
420
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.5k
Bucharest Tech Week 2026 - Reinventing testing practices in the AI era
edeandrea
PRO
1
160
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
1k
Agent Skills設計で柔軟性と硬さのバランスが難しい話
nassy20
0
130
"何を作るか"を任される エンジニアは、どう育つのか
yutaokafuji
1
680
脆弱性対応、どこで線を引くか
rymiyamoto
1
390
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.9k
フロンティアAIのゲート化と地政学リスク
nagatsu
0
140
Featured
See All Featured
Designing for Timeless Needs
cassininazir
1
250
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
610
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
240
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
420
Technical Leadership for Architectural Decision Making
baasie
3
410
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
Documentation Writing (for coders)
carmenintech
77
5.4k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Marketing to machines
jonoalderson
1
5.4k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Transcript
あなたの興味は信頼性? それとも生産性? SREとしてのキャリアに悩む みなさまに伝えたい選択肢
Kazuto Kusama @jacopen Product Evangelist @PagerDuty Japan Organizer @Platform Engineering
Meetup Founder @Cloud Native Innovators Association Organizer @SRE Kaigi
Platform Engineering推進の団体をやっています 一般社団法人 クラウドネイティブイノベーターズ協会 Platform Engineering Meetup
質問 SREで居続けるの 難しくないですか?
SREが登場してから22年 GoogleでSREが提唱されたのが2003年(!) オライリーからSite Reliability Engineeringが出版 されたのが2016年。 日本語版は2017年の8月 これ以降、日本でも採用する事例が増えてきた
どうしてSREが必要とされたんだろう そのほうがかっこいいから システムの複雑化 安定性に対する要求 クラウド化(による自動化の余地) ベストプラクティスの導入
どうしてSREが必要とされたんだろう そのほうがかっこいいから システムの複雑化 →といいつつ、本当にマイクロサービスやってる組織がどのくらいあるのか 安定性に対する要求 →誰に聞いたってそりゃ障害が少なくて安定しているほうがいいって言う クラウド化(による自動化の余地) →ベンダーの後押しもあり自動化に注目があつまった ベストプラクティスの導入 →流行り物に乗った方がいろんな知見を効率よく得られてコスパ・タイパがいい
そして生まれるなんちゃってSRE • インフラ運用チームが名前を変えただけ • 開発者数名で始めたスタートアップが 「クラウドと自動化できる便利な人が欲しい」という理由でSREを設置 • 人材募集する際に、人を集めやすいカテゴリにした方がいいからSREを設置 • 大手企業が「新しい取り組みやってます」アピールのため
そして生まれるなんちゃってSRE • インフラ運用チームが名前を変えただけ • 開発者数名で始めたスタートアップが 「クラウドと自動化できる便利な人が欲しい」という理由でSREを設置 • 人材募集する際に、人を集めやすいカテゴリにした方がいいからSREを設置 • 大手企業が「新しい取り組みやってます」アピールのため
ビジネスの合理性を考えると、必ずしも問題とも言えない でもこういうSREのイベントに来ると、「このままで良いんだろうか・・・」と悩む
今日話したいと思っていること みなさんの悩みをスパっと解決できるものではないです 自分がありたいエンジニア像を描く際の材料を提供する
そもそも信頼性って何だっけ?
そもそも信頼性って何だっけ? • SLO • SLI • MTTR • MTBF •
…
信頼性を上げる最も効率のいい方法
なにもしないこと
何かするから障害がおきる “障害のほとんどはデプロイによって引き起こされる。 したがって、デプロイが増えると障害も増え、結果と してインシデント管理、軽減策、ポストモーテムが必 要となる” エレガントパズル エンジニアのマネジメントという難問にあなたはどう立ち向かうの か より引用 言い方を変えると、デプロイをしなければ障害は減る
だからデプロイ減らしましょ ・・・とはならない (よね?) 今の世の中勝ち残るには、素早く開発して素早く市場に投入するという取り組み が必須。だからこそ、アジャイル開発やDevOpsが必要とされる でもそれだとインシデントが増えるので、SREが必要となる アジャイルもやってないしDevOpsも形だけ。リリース頻度変わってないのに SREとか言い始めると、「なんちゃってSRE」の可能性がとても高い。 おそらくあなたに求められるのは、信頼性向上ではなく クラウドが出来る便利屋さん
注: こうは書いてますけど、「便利屋さん上等!オレがなんとかしてやる」と いう意気込みでいるのは全然アリだとおもいます。ここで言いたいのは、前段 のアジャイルやDevOpsがろくに回ってないのに、形だけSREやっても意味が 無いので、もっと先にやるべきことがあるよね、ということです
Four Keys • デプロイの頻度 ◦ 変更を本番環境にデプロイ、あるいはエンドユーザーにリリースした頻度 • 変更のリードタイム ◦ 変更のコミットから、本番環境で正常に実行されるまでの時間
• 変更失敗率 ◦ デプロイによって本番環境で障害が発生する割合 • デプロイ失敗時の復元までの時間 ◦ 本番環境での障害から復元までにかかる時間 Four Keysがよく取り上げられますが、大きく分けると上下 2つに分けられます。上だけ高める、下だけ高めるのは難し くない。全部高めるのが大事だし、チャレンジングな点
SREの探求 より引用
SREの探求 より引用 Site Reliability Engineer として求められる領域
SREの探求 より引用 Site Reliability Engineer として求められる領域 実態
SREの探求 より引用 Site Reliability Engineer として求められる領域 実態 ここばっかり やっている人もいる 開発側もなんとかしないといけない、となって、
結局右から左のSREではなく左から右の取り組み まで全部やってるっていう
そんな中で出てきたもの Platform Engineering
Platform Engineeringとは 開発者体験と生産性を向上させるために セルフサービスで利用できるツールチェーンとワークフローを 設計・構築する分野 定義で言うとこういうのがあります
あーあれでしょ 共通基盤作ろうってやつでしょ 大きな会社なら必要あるかもだけど ウチはまだそういう感じじゃないかなー って思う人いるかもしれないので、ちょっと違った表 現をしてみます
真のDevOps 開発者が、アプリをエンドツーエンドでデプロイし、実行する ただし、多くの組織にとって現実的ではない Kubernetes Buildkit Helm Dockerfile Grafana Prometheus GitHub
Actions React Next.js Security Node.js Terraform ArgoCD APM Compliance 認知負荷が 高すぎる これをやり切れ る人材は少ない
https://www.infoq.com/articles/platform-engineering-primer/ より引用 認知負荷の増大が問題に クラウドの浸透、クラウドネイティブ技術の登場、マイクロサービス化の流れ、 エンジニアの責任範囲の拡大により認知負荷が大変なことに
くっそめんどくさい! 自分もコード書くことありますが、コード書く頭の時 にデプロイのこと考えるのちょう面倒くさい
くっそめんどくさい!
認知負荷の増大による生産性の低下が 無視出来なくなりつつある この「くっそめんどくさい」が世界中で起きているの が今
じゃあ、どうすればいいのか
くっそめんどくさい対策 • 自分で無理に頑張るより、その道のプロにお願いしたい • 全部任せたいけど、難しい場合はせめて相談に乗って欲しい。 適切な情報提供をお願いしたい
くっそめんどくさい対策 • 自分で無理に頑張るより、その道のプロにお願いしたい • 全部任せたいけど、難しい場合はせめて相談に乗って欲しい。 適切な情報提供をお願いしたい その道のプロ = Platform Team
その道のプロを体系だって作っていく取り組み = Platform Engineering 開発者側からみたPlatform Engineeringの理解は、この程度でいいと思います
くっそめんどくさい対策 • 自分で無理に頑張るより、その道のプロにお願いしたい • 全部任せたいけど、難しい場合はせめて相談に乗って欲しい。 適切な情報提供をお願いしたい どうお願いするのか。その任せ方、関わり方 教えを請う? 手伝って貰う? それとも・・・
Team Topologies 価値のあるソフトウェアを素早く届けられるよ うにするための組織設計。 4タイプのチーム定義と、3つのインタラクショ ンモードが定義されている。
4つのチームタイプ Stream-aligned team ビジネスのストリームに沿って配置するチー ム。ビジネスの中心 Complicated Subsystem team 複雑なサブシステムやコンポーネントを扱う チーム。その分野のスペシャリストが集まる
Enabling team 他のチームが新しい技術やスキルを身につける 支援をするチーム ★Platform team インフラやツール、共通サービスなどのプラッ トフォームを提供するチーム
3つのインタラクションモード ファシリテーション 一方のチームが他のチームの障害を取り除くた めに支援をしたり、支援されたりする。同時に 複数のチームと連携することもある コラボレーション 2つのチームが密接に協力して作業する。同時に コラボレーションできるのは1チームまで ★X-as-a-Service 他のチームが提供するものをサービスとして利
用する関係性。責任分界点が明確。疎結合。
その道のプロ(= Platform Team)との関わり方 開発チーム その道のプロ 開発チーム その道のプロ Collaboration Facilitating その道のプロが開発チームに勉強会を
開いたり、Slackで情報提供 その道のプロが開発チームにジョインし Manifest書くのを担う 開発チーム その道のプロ XaaS その道のプロが用意したプラットフォームの レールの上で開発
その道のプロとの関わり方 開発チーム その道のプロ 開発チーム その道のプロ Collaboration Facilitating その道のプロが開発チームに勉強会を 開いたり、Slackで情報提供 その道のプロが開発チームにジョインし
Manifest書くのを担う 開発チーム その道のプロ XaaS その道のプロが用意したプラットフォームの レールの上で開発 最終的にはここを目指す この過程も大事
Platform Teamが担うこと • 開発者の認知負荷軽減を一番の目的として取り組む • 開発の助けになるような情報を整理する • あらゆる技術に精通することは難しく、ガバナンスを効かせていく必要もあ るので、Platform Teamは技術の『標準』を定めていく
• スムーズに取り組めるようオンボーディングの仕組みをととのえる • 必要に応じて勉強会やワークショップの開催を行う • 開発者からの質問や問い合わせに対して対応する • 開発者がセルフサービスで利用できる、自動化されたプラットフォーム を作っていく
自分のやってることって こっちなのでは? 🤔 っていう話をすると、いまSREをやっている人も、実 態としてはこっちなんでは?という人もいるかも
SREの探求 より引用 SRE Platform Engineering
ここで言いたいこと 「SREじゃなくてPlatform Engineeringやれ」とか、 「それはSREって名乗るべきじゃない」とか そういう主張をしたいわけでは全くないです 既に確立されたSREチームがPE的なことをやることもあるだろうし、限られた人 数なので一人で両方を担うみたいなケースも全然あると思います 定義は定義で理解しつつも、実態はうまく調整すれば良いです 僕はそのために商標取ったりしないので安心してください 自分の定義を主張するために商標取るなんて人もいるらしい
ですけど、それって不毛なので、定義は定義、実態は実態で うまいこと考えていけばいいんじゃないでしょうか
ただ 自分のモチベーションが右から左なのか、左から右なのかは、考えておいたほう がいいです。 そうすることで、適した情報源に当たりやすくなります。 SREの探求 より引用 右から左 SRE 左から右 Platform
Engineering
deeeetさんとの対談 プラットフォーム開発に関わる人は 「ドラクエでしっかりとスクルトと バイキルトで強化してからボスに望 むのが好きな人」 なんじゃないかという仮説 「プロダクティビティを改善するこ とは、つまり皆を強くすることであ り、みんなで強くなることによっ て、より早くプロダクトを出せるよ
うになっていく」 チーム全員の生産性を上げる! メルカリ deeeetさんに聞く、Platform Engineeringの醍醐味 https://codezine.jp/article/detail/20283
こういう人 MMORPGだとバッファータイプ Minecraftでひたすら装置作り
共通するところ • ソフトウェア開発に対する知識、スキル • 自動化・効率化に対するモチベーション • 他チームと連携しながら組織を前進させる • 継続的な改善と学習文化 SRE
• 信頼性・可用性への強いコミット • 分析・監視・運用設計の能力 • 障害対応から得た実践的知識 • データドリブンな意思決定 Platform Engineering • プラットフォームの設計・開発における技術力 • ユーザー視点のプロダクト開発マインド • 組織全体、複数サービスを見渡す抽象化・標準 化への意識 繰り返しになりますけど、SREというタイトルでPlatform Engineeringやっていても良いと思います。共通する項目も多 いので。でも、自分がどっちに対してやりがいを感じるかは、 心の中で整理しておくと良いです。
最後に、流行りのアレ
AI x (SRE | Platform Engineering) 好む好まざるとに関わらず、AIを活用したSRE / Platform Engineeringの実践は
不可避。 一昨年〜昨年にかけてのRAGを使ったアプローチは上手くいかないケースが多 かった ただ昨年末から盛り上がっているAIエージェントのアプローチは、かなり親和性が 高いように思う(特にPlatform Engineering) 具体的な事例が出てくるのはこれからだが、暖かくなってくる時期から一気に情報 が出てくると思われる
AI Driven Development ここ数ヶ月のソフトウェア開発におけるAI Agent の発展がすさまじい 全ての開発が直ちに置き換わるとは思わないが、 全ての開発が「影響を受ける」というのは過言で はない なので、これが開発のメインストリームとなった
ときに、SREに求められるのは何か、Platform Engineerに求められるのは何かを早いうちから考 えておくべき まずは自分で触ってみて Cursor composer agent Devin Cline bolt.new いまこの時点では、一定の規模を超えるものを作らせるに は力不足なAIドリブン開発ですが、徐々にやれる規模は広 がるでしょうし、一部のタスクをAIにやらせるというのは 今でも可能。 まずはしゅっと触って感覚を掴むのがお勧め
The augmented LLM MCP(Model Context Protocol)や Computer Use, browser-useのように、 LLMと外部がやり取り出来る標準のイン
ターフェースが生まれ始めた まずは自社で身近な何かを連携させて仕組み を作ってみるのがおすすめ AnthropicのBuilding effective agentsとい う記事がとてもよく出来ているので、これを 参考にちいさなエージェントを考えてみるの がよさそう https://www.anthropic.com/research/building-eff ective-agents https://www.anthropic.com/research/building-effective-agents より引用
まとめ • SREの主目的は「信頼性」 • 認知負荷の削減、開発生産性の向上のための「Platform Engineering」 • SREとPlatform Engineerを明確に分ける必要はないが、自分がどっちを志向 しているのかは理解しておいた方が良い
• AIは不可避
Platform Engineering Meetup特別回やります! 2/19に発売 発売に先立って、2/13に発売記念イベントを兼ねた Meetupを開催します! 一週間も早く入手出来る、書籍の先行販売 著者 Mauricio Salatinoさん登壇
& サイン会 翻訳者 nwiizoさん登壇 & サイン会