Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで
Search
Hiroki Takatsuka
April 06, 2025
Technology
1
120
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで
ゆるSRE勉強会 #10 - connpass
https://yuru-sre.connpass.com/event/348136/
Hiroki Takatsuka
April 06, 2025
Tweet
Share
More Decks by Hiroki Takatsuka
See All by Hiroki Takatsuka
どちらかだけじゃもったいないかも? ECSとEKSを適材適所で併用するメリット、運用課題とそれらの対応について
tk3fftk
2
500
そろそろOn-Callの通知音について考えてみよう (PagerDuty編)
tk3fftk
1
720
なにもしてないのにNew Relicのデータ転送量が増えていたときに確認したこと
tk3fftk
3
410
緊急SOS!KubernetesのCompletedな10万Jobぜんぶ消す
tk3fftk
3
6.8k
1人目の専任SREがポストモーテム文化を改善したらエンジニア以外にも広まり、 他部門との連携も強化された話+
tk3fftk
2
3.2k
Aurora MySQL ハマリポイントと対応
tk3fftk
1
540
Other Decks in Technology
See All in Technology
Introduction to Bill One Development Engineer
sansan33
PRO
0
230
大事なのは、AIの精度だけじゃない!〜1円のズレも許されない経理領域とAI〜
jun_nemoto
8
4.6k
君だけのオリジナル async / await を作ろう / TSKaigi 2025
susisu
17
12k
CloudTrailも、GuardDutyも、VPC Flow logsも… ログ多すぎ問題の整理術
nikuyoshi
5
550
Bill One 開発エンジニア 紹介資料
sansan33
PRO
4
12k
GitHub ActionsをTypeScriptで作ろう!
sansantech
PRO
2
390
AWS LambdaでSocket通信サーバーレスアプリケーションのリアルタイム通信 / 20250523 Kumiko Hennmi
shift_evolve
1
330
オープンソースとビジネス: 位置情報の世界からみえる流れ / 札幌IT石狩鍋#2
sorami
0
220
AIに実況させる / AI Streamer
motemen
2
1.2k
オープンソースのハードウェアのコンテストに参加している話
iotengineer22
0
200
グループ ポリシー再確認 ③
murachiakira
0
140
シンプルな設定ファイルで実現する AWS IAM Identity Center のユーザー管理と開発チームへの委譲 / Delegating AWS IAM Identity Center User Management with a Simple DSL
yamaguchitk333
3
450
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
100
5.6k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Typedesign – Prime Four
hannesfritz
41
2.6k
Bash Introduction
62gerente
613
210k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.7k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.3k
Gamification - CAS2011
davidbonilla
81
5.3k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Code Reviewing Like a Champion
maltzj
523
40k
4 Signs Your Business is Dying
shpigford
183
22k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
21k
Fireside Chat
paigeccino
37
3.5k
Transcript
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで ゆるSRE勉強会#10 2025/04/04 primeNumber Inc. プロダクト開発本部 SRE Group 髙塚
広貴 (@tk3fftk)
目次 2 1. はじめに 2. 何を話すのか 3. なぜSREチームを分割しようとしているか 4. どうSREチームを分割しようとしているか
5. まとめ
3 髙塚広貴 (@tk3fftk) 株式会社primeNumber Head of SRE • ヤフー株式会社 (2016
~ 2022) ◦ CI/CDプラットフォーム Screwdriver.cd SREチームのスクラムマスターやEM • 株式会社primeNumber (2022 ~ ) ◦ TROCCO®/COMETA®のSRE/Security • 猫🐈 ◦ アルくん (アビシニアン ♂ 5歳) • ゆるSREのLTは2回目 ◦ #8でPagerDutyの通知音の話をしました
会社概要 4 株式会社primeNumber 代表取締役CEO 田邊 雄樹 2015年11月 約105名 約34億円 東京都品川区上大崎3丁目1番1号
JR東急目黒ビル5F 会社名 代表 創業 メンバー数 累計調達額 オフィス © primeNumber Inc.
あらゆるデータを、 ビジネスの力に変える。 人とAIが共存する時代に。 知の源泉となるデータを、 誰もがすばやく、自由に使えるように。 primeNumberは、テクノロジーの力で データ活用における不自由をなくし、 あらゆるデータを、ビジネスの力に変えていく。 そして、それまでの常識や産業の枠を超えて、 さまざまな人や企業、技術、アイデアとつながり、
まだない価値を共に生み出していく。 私たちは、人とデータの開かれた関係を築くことで、 人の創造力を解放し、 世界中のビジネスと社会全体の可能性を拡げます。 VISION 5 © primeNumber Inc.
6 primeNumberの事業 データエンジニアリング知識の有無にかかわらず、「あらゆるデータを、ビジネスの力に変える」を実現 するべく、複数のプロダクト・サービスを提供しています。 © primeNumber Inc. 活用 分析 可視化
蓄積 統合 点在 データテクノロジー領域の課題解決を実現する コンサルティング・エンジニアリングサービス データ基盤の構築や運用を 支援するクラウドETL データの発見・理解・活用を 促進するデータカタログサービス 顧客データ分析後の施策実行 (“ACTION”)を支援するサービス
7 今日話したいこと
8 SREの組織的な話ってあんまり転がってない?ような気がする • SREチーム、Embedded / Platform みたいな分け方はおそらく一般的 • でもみんなそれって「いつ」「なぜ」分けたの? •
一例として自分がここ数ヶ月で分けるためにやった話を持ってきた • 「うちはこうだったよ」みたいな話をぜひ懇親会で聞きたく 🙏
9 なぜSREチームを分割しようとしたのか
10 背景 primeNumberのSRE組織は、プロダクトの信頼性向上を主軸に置きつつ、セキュリティ基盤 の構築、クラウドの組織管理、利用SaaSの管理など、幅広い領域を担当しています。 プロダクトや組織の急成長にともない、プロダクトの信頼性と、全社で利用されるシステム の信頼性という異なる信頼性を1チームで最適化することが困難になってきました。 特に、クラウドネイティブ環境におけるセキュリティガバナンスの高度化や、SaaS統合管理 の複雑化が顕著になる中で「Corporate SRE」という新たな専門チームを立ち上げるに至り ました。
SREの知見を全社横断で適用し、組織の信頼性を高める Corporate SRE - 株式会社primeNumber より
11 とか言ってますが「やることが..やることが多い..!!」状態になったため • SREチームの正社員2人(うち1人はEMかつ兼務あり)しかいないのよ〜😭 ◦ (でもついに今度3人目が入ってくれます、やったね!!! • SREの責務が増えてきて1チームで全部見るのはつらい ◦ 「プロダクト」のSREをやりながらAWS
Organization管理など全社利用のモノも見 るのはコンテキストスイッチが激しい (たぶんあるあるだけど) ▪ 組織のサイズが小さいうちはやむなしだけど、100人越えたらそうも言ってられない • 他チーム・部署に移譲できないのか? ◦ 逆にお願いされたり、すでに連携して進めているものも • 最適化するなら、求められるマインドやスキルセットも異なっているはず 👉 チーム分けてポジション作って採用を目指そう!
12 どうSREチームを分割しようとしたか
13 こうしようとしている、のでここに至るまでを話します
14 まずは業務の洗い出し(サクセッションプランニング)からやってみた • エレガントパズル で知ったやつ • 本来は自分の後任を見つける・育成するためのプロセス 自分は何をしているのか?を理解する (リストアップする)ことが第一歩 -
カレンダーを見てミーティングで の役割を書き留める - カレンダーを見てミーティング以 外のことを書き留める - 繰り返し行われてきたプロセス と、そのプロセスにおける役割を 書き留める
15 これを領域に合わせてざっくりマッピング チームを分けるといってもすぐに人を増やせるわけではないので、仮想的にチーム内チーム
16 ちょっと先の展望も考える • 業務委託メンバーへは徐々にCorp SRE領域のタスクをアサインしていくようにする • Corp SRE領域向けのJob Description(≒ 求人、募集要項)を作って採用候補者を探す
◦ Product SRE領域とは求めるマインド・スキルセットが異なるはずなので、別枠に
17 確度は低いがさらに先の展望も考えておく • 「人が取れる」前提になるが完全に分離し、Corp SREはよりSecurity, CorpIT領域との連携を強めて いきたい • マネジメント層の想定などはひとまずpending
18 できあがったのがこちらになります SREの知見を全社横断で適用し、組織の信頼性を高める Corporate SRE - 株式会社primeNumber より
19 Q. なんで “Corporate SRE” なの? A. 誤解やミスマッチをできるだけ減らしたい • セキュリティチームと情シスと連携してる部分を一緒にやる+全社SaaS管理などを想定
◦ 組織の信頼性を高める 〜SRE/情シス/セキュリティの領域を超えて〜の影響が大きい • プロダクトが多くないので、開発組織が分散してない ◦ EmbeddedとPlatformという分け方をすると誤解やミスマッチが起こりそう ▪ 入ったら「ぜんぜんPlatformちゃうやんけ!!!」とぼくならなります、たぶん ◦ AWSとかGoogle Cloudは見てもらうけどCCoEってほどでもないし… • プロダクト領域のSREとコーポレート領域SRE的な分け方をするのがいいのではないか
20 まとめ・所感
21 まとめ・所感 • pN社でSREがなぜ、どう考えてSREチームを分けたかを話してみました ◦ 結果はこれから… ◦ 懇親会でぜひみなさんの話も聞かせてください👂 • 即分割、とはいかないので兆候が見えたら考えはじめてみてもいいかも
• 越境した業務に悩んでる人は組織の信頼性を高める 〜SRE/情シス/セキュリ ティの領域を超えて〜の資料を見るといいぞ! • ポジション作るときはスカウト文や選考フローもセットで考えようね (大慌て した人より)