Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで
Search
Hiroki Takatsuka
April 06, 2025
Technology
1
100
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで
ゆるSRE勉強会 #10 - connpass
https://yuru-sre.connpass.com/event/348136/
Hiroki Takatsuka
April 06, 2025
Tweet
Share
More Decks by Hiroki Takatsuka
See All by Hiroki Takatsuka
どちらかだけじゃもったいないかも? ECSとEKSを適材適所で併用するメリット、運用課題とそれらの対応について
tk3fftk
2
470
そろそろOn-Callの通知音について考えてみよう (PagerDuty編)
tk3fftk
1
690
なにもしてないのにNew Relicのデータ転送量が増えていたときに確認したこと
tk3fftk
3
400
緊急SOS!KubernetesのCompletedな10万Jobぜんぶ消す
tk3fftk
3
6.8k
1人目の専任SREがポストモーテム文化を改善したらエンジニア以外にも広まり、 他部門との連携も強化された話+
tk3fftk
2
3.1k
Aurora MySQL ハマリポイントと対応
tk3fftk
1
520
Other Decks in Technology
See All in Technology
Microsoft の SSE の現在地
skmkzyk
0
280
Dynamic Reteaming And Self Organization
miholovesq
3
740
ドキュメント管理の理想と現実
kazuhe
3
310
2025-04-14 Data & Analytics 井戸端会議 Multi tenant log platform with Iceberg
kamijin_fanta
0
180
生成AIによるCloud Native基盤構築の可能性と実践的ガードレールの敷設について
nwiizo
7
1.4k
【Oracle Cloud ウェビナー】ご希望のクラウドでOracle Databaseを実行〜マルチクラウド・ソリューション徹底解説〜
oracle4engineer
PRO
1
140
社会人力と研究力ー博士号をキャリアの武器にするー
kentaro
2
100
SnowflakeとDatabricks両方でRAGを構築してみた
kameitomohiro
1
560
テストって楽しい!開発を加速させるテストの魅力 / Testing is Fun! The Fascinating of Testing to Accelerate Development
aiandrox
0
160
10分で学ぶ、RAGの仕組みと実践
supermarimobros
0
710
コスト最適重視でAurora PostgreSQLのログ分析基盤を作ってみた #jawsug_tokyo
non97
1
850
【Λ(らむだ)】最近のアプデ情報 / RPALT20250422
lambda
0
330
Featured
See All Featured
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.7k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.7k
Scaling GitHub
holman
459
140k
Git: the NoSQL Database
bkeepers
PRO
430
65k
Making the Leap to Tech Lead
cromwellryan
133
9.2k
Visualization
eitanlees
146
16k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.2k
How STYLIGHT went responsive
nonsquared
100
5.5k
Rebuilding a faster, lazier Slack
samanthasiow
81
9k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
52
2.4k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Transcript
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで ゆるSRE勉強会#10 2025/04/04 primeNumber Inc. プロダクト開発本部 SRE Group 髙塚
広貴 (@tk3fftk)
目次 2 1. はじめに 2. 何を話すのか 3. なぜSREチームを分割しようとしているか 4. どうSREチームを分割しようとしているか
5. まとめ
3 髙塚広貴 (@tk3fftk) 株式会社primeNumber Head of SRE • ヤフー株式会社 (2016
~ 2022) ◦ CI/CDプラットフォーム Screwdriver.cd SREチームのスクラムマスターやEM • 株式会社primeNumber (2022 ~ ) ◦ TROCCO®/COMETA®のSRE/Security • 猫🐈 ◦ アルくん (アビシニアン ♂ 5歳) • ゆるSREのLTは2回目 ◦ #8でPagerDutyの通知音の話をしました
会社概要 4 株式会社primeNumber 代表取締役CEO 田邊 雄樹 2015年11月 約105名 約34億円 東京都品川区上大崎3丁目1番1号
JR東急目黒ビル5F 会社名 代表 創業 メンバー数 累計調達額 オフィス © primeNumber Inc.
あらゆるデータを、 ビジネスの力に変える。 人とAIが共存する時代に。 知の源泉となるデータを、 誰もがすばやく、自由に使えるように。 primeNumberは、テクノロジーの力で データ活用における不自由をなくし、 あらゆるデータを、ビジネスの力に変えていく。 そして、それまでの常識や産業の枠を超えて、 さまざまな人や企業、技術、アイデアとつながり、
まだない価値を共に生み出していく。 私たちは、人とデータの開かれた関係を築くことで、 人の創造力を解放し、 世界中のビジネスと社会全体の可能性を拡げます。 VISION 5 © primeNumber Inc.
6 primeNumberの事業 データエンジニアリング知識の有無にかかわらず、「あらゆるデータを、ビジネスの力に変える」を実現 するべく、複数のプロダクト・サービスを提供しています。 © primeNumber Inc. 活用 分析 可視化
蓄積 統合 点在 データテクノロジー領域の課題解決を実現する コンサルティング・エンジニアリングサービス データ基盤の構築や運用を 支援するクラウドETL データの発見・理解・活用を 促進するデータカタログサービス 顧客データ分析後の施策実行 (“ACTION”)を支援するサービス
7 今日話したいこと
8 SREの組織的な話ってあんまり転がってない?ような気がする • SREチーム、Embedded / Platform みたいな分け方はおそらく一般的 • でもみんなそれって「いつ」「なぜ」分けたの? •
一例として自分がここ数ヶ月で分けるためにやった話を持ってきた • 「うちはこうだったよ」みたいな話をぜひ懇親会で聞きたく 🙏
9 なぜSREチームを分割しようとしたのか
10 背景 primeNumberのSRE組織は、プロダクトの信頼性向上を主軸に置きつつ、セキュリティ基盤 の構築、クラウドの組織管理、利用SaaSの管理など、幅広い領域を担当しています。 プロダクトや組織の急成長にともない、プロダクトの信頼性と、全社で利用されるシステム の信頼性という異なる信頼性を1チームで最適化することが困難になってきました。 特に、クラウドネイティブ環境におけるセキュリティガバナンスの高度化や、SaaS統合管理 の複雑化が顕著になる中で「Corporate SRE」という新たな専門チームを立ち上げるに至り ました。
SREの知見を全社横断で適用し、組織の信頼性を高める Corporate SRE - 株式会社primeNumber より
11 とか言ってますが「やることが..やることが多い..!!」状態になったため • SREチームの正社員2人(うち1人はEMかつ兼務あり)しかいないのよ〜😭 ◦ (でもついに今度3人目が入ってくれます、やったね!!! • SREの責務が増えてきて1チームで全部見るのはつらい ◦ 「プロダクト」のSREをやりながらAWS
Organization管理など全社利用のモノも見 るのはコンテキストスイッチが激しい (たぶんあるあるだけど) ▪ 組織のサイズが小さいうちはやむなしだけど、100人越えたらそうも言ってられない • 他チーム・部署に移譲できないのか? ◦ 逆にお願いされたり、すでに連携して進めているものも • 最適化するなら、求められるマインドやスキルセットも異なっているはず 👉 チーム分けてポジション作って採用を目指そう!
12 どうSREチームを分割しようとしたか
13 こうしようとしている、のでここに至るまでを話します
14 まずは業務の洗い出し(サクセッションプランニング)からやってみた • エレガントパズル で知ったやつ • 本来は自分の後任を見つける・育成するためのプロセス 自分は何をしているのか?を理解する (リストアップする)ことが第一歩 -
カレンダーを見てミーティングで の役割を書き留める - カレンダーを見てミーティング以 外のことを書き留める - 繰り返し行われてきたプロセス と、そのプロセスにおける役割を 書き留める
15 これを領域に合わせてざっくりマッピング チームを分けるといってもすぐに人を増やせるわけではないので、仮想的にチーム内チーム
16 ちょっと先の展望も考える • 業務委託メンバーへは徐々にCorp SRE領域のタスクをアサインしていくようにする • Corp SRE領域向けのJob Description(≒ 求人、募集要項)を作って採用候補者を探す
◦ Product SRE領域とは求めるマインド・スキルセットが異なるはずなので、別枠に
17 確度は低いがさらに先の展望も考えておく • 「人が取れる」前提になるが完全に分離し、Corp SREはよりSecurity, CorpIT領域との連携を強めて いきたい • マネジメント層の想定などはひとまずpending
18 できあがったのがこちらになります SREの知見を全社横断で適用し、組織の信頼性を高める Corporate SRE - 株式会社primeNumber より
19 Q. なんで “Corporate SRE” なの? A. 誤解やミスマッチをできるだけ減らしたい • セキュリティチームと情シスと連携してる部分を一緒にやる+全社SaaS管理などを想定
◦ 組織の信頼性を高める 〜SRE/情シス/セキュリティの領域を超えて〜の影響が大きい • プロダクトが多くないので、開発組織が分散してない ◦ EmbeddedとPlatformという分け方をすると誤解やミスマッチが起こりそう ▪ 入ったら「ぜんぜんPlatformちゃうやんけ!!!」とぼくならなります、たぶん ◦ AWSとかGoogle Cloudは見てもらうけどCCoEってほどでもないし… • プロダクト領域のSREとコーポレート領域SRE的な分け方をするのがいいのではないか
20 まとめ・所感
21 まとめ・所感 • pN社でSREがなぜ、どう考えてSREチームを分けたかを話してみました ◦ 結果はこれから… ◦ 懇親会でぜひみなさんの話も聞かせてください👂 • 即分割、とはいかないので兆候が見えたら考えはじめてみてもいいかも
• 越境した業務に悩んでる人は組織の信頼性を高める 〜SRE/情シス/セキュリ ティの領域を超えて〜の資料を見るといいぞ! • ポジション作るときはスカウト文や選考フローもセットで考えようね (大慌て した人より)