Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで
Search
Hiroki Takatsuka
April 06, 2025
Technology
1
83
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで
ゆるSRE勉強会 #10 - connpass
https://yuru-sre.connpass.com/event/348136/
Hiroki Takatsuka
April 06, 2025
Tweet
Share
More Decks by Hiroki Takatsuka
See All by Hiroki Takatsuka
どちらかだけじゃもったいないかも? ECSとEKSを適材適所で併用するメリット、運用課題とそれらの対応について
tk3fftk
2
450
そろそろOn-Callの通知音について考えてみよう (PagerDuty編)
tk3fftk
1
630
なにもしてないのにNew Relicのデータ転送量が増えていたときに確認したこと
tk3fftk
3
390
緊急SOS!KubernetesのCompletedな10万Jobぜんぶ消す
tk3fftk
3
6.7k
1人目の専任SREがポストモーテム文化を改善したらエンジニア以外にも広まり、 他部門との連携も強化された話+
tk3fftk
2
3k
Aurora MySQL ハマリポイントと対応
tk3fftk
1
510
Other Decks in Technology
See All in Technology
Tokyo dbt Meetup #13 dbtと連携するBI製品&機能ざっくり紹介
sagara
0
420
ブラウザのレガシー・独自機能を愛でる-Firefoxの脆弱性4選- / Browser Crash Club #1
masatokinugawa
1
370
アジャイル脅威モデリング#1(脅威モデリングナイト#8)
masakane55
3
140
JPOUG Tech Talk #12 UNDO Tablespace Reintroduction
nori_shinoda
1
110
GitHub MCP Serverを使って Pull Requestを作る、レビューする
hiyokose
2
700
Creating Awesome Change in SmartNews
martin_lover
1
220
バックオフィス向け toB SaaS バクラクにおけるレコメンド技術活用 / recommender-systems-in-layerx-bakuraku
yuya4
2
220
2025年春に見直したい、リソース最適化の基本
sogaoh
PRO
0
460
Amazon S3 Tables + Amazon Athena / Apache Iceberg
okaru
0
230
Amazon CloudWatch Application Signals ではじめるバーンレートアラーム / Burn rate alarm with Amazon CloudWatch Application Signals
ymotongpoo
5
290
食べログが挑む!飲食店ネット予約システムで自動テスト無双して手動テストゼロを実現する戦略
hagevvashi
1
150
30 代子育て SRE が考える SRE ナレッジマネジメントの現在と将来
kworkdev
PRO
0
200
Featured
See All Featured
How to Ace a Technical Interview
jacobian
276
23k
Optimizing for Happiness
mojombo
377
70k
Speed Design
sergeychernyshev
29
880
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.4k
Adopting Sorbet at Scale
ufuk
76
9.3k
Optimising Largest Contentful Paint
csswizardry
36
3.2k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.2k
Statistics for Hackers
jakevdp
798
220k
Code Reviewing Like a Champion
maltzj
522
39k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Building a Modern Day E-commerce SEO Strategy
aleyda
40
7.2k
What's in a price? How to price your products and services
michaelherold
245
12k
Transcript
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで ゆるSRE勉強会#10 2025/04/04 primeNumber Inc. プロダクト開発本部 SRE Group 髙塚
広貴 (@tk3fftk)
目次 2 1. はじめに 2. 何を話すのか 3. なぜSREチームを分割しようとしているか 4. どうSREチームを分割しようとしているか
5. まとめ
3 髙塚広貴 (@tk3fftk) 株式会社primeNumber Head of SRE • ヤフー株式会社 (2016
~ 2022) ◦ CI/CDプラットフォーム Screwdriver.cd SREチームのスクラムマスターやEM • 株式会社primeNumber (2022 ~ ) ◦ TROCCO®/COMETA®のSRE/Security • 猫🐈 ◦ アルくん (アビシニアン ♂ 5歳) • ゆるSREのLTは2回目 ◦ #8でPagerDutyの通知音の話をしました
会社概要 4 株式会社primeNumber 代表取締役CEO 田邊 雄樹 2015年11月 約105名 約34億円 東京都品川区上大崎3丁目1番1号
JR東急目黒ビル5F 会社名 代表 創業 メンバー数 累計調達額 オフィス © primeNumber Inc.
あらゆるデータを、 ビジネスの力に変える。 人とAIが共存する時代に。 知の源泉となるデータを、 誰もがすばやく、自由に使えるように。 primeNumberは、テクノロジーの力で データ活用における不自由をなくし、 あらゆるデータを、ビジネスの力に変えていく。 そして、それまでの常識や産業の枠を超えて、 さまざまな人や企業、技術、アイデアとつながり、
まだない価値を共に生み出していく。 私たちは、人とデータの開かれた関係を築くことで、 人の創造力を解放し、 世界中のビジネスと社会全体の可能性を拡げます。 VISION 5 © primeNumber Inc.
6 primeNumberの事業 データエンジニアリング知識の有無にかかわらず、「あらゆるデータを、ビジネスの力に変える」を実現 するべく、複数のプロダクト・サービスを提供しています。 © primeNumber Inc. 活用 分析 可視化
蓄積 統合 点在 データテクノロジー領域の課題解決を実現する コンサルティング・エンジニアリングサービス データ基盤の構築や運用を 支援するクラウドETL データの発見・理解・活用を 促進するデータカタログサービス 顧客データ分析後の施策実行 (“ACTION”)を支援するサービス
7 今日話したいこと
8 SREの組織的な話ってあんまり転がってない?ような気がする • SREチーム、Embedded / Platform みたいな分け方はおそらく一般的 • でもみんなそれって「いつ」「なぜ」分けたの? •
一例として自分がここ数ヶ月で分けるためにやった話を持ってきた • 「うちはこうだったよ」みたいな話をぜひ懇親会で聞きたく 🙏
9 なぜSREチームを分割しようとしたのか
10 背景 primeNumberのSRE組織は、プロダクトの信頼性向上を主軸に置きつつ、セキュリティ基盤 の構築、クラウドの組織管理、利用SaaSの管理など、幅広い領域を担当しています。 プロダクトや組織の急成長にともない、プロダクトの信頼性と、全社で利用されるシステム の信頼性という異なる信頼性を1チームで最適化することが困難になってきました。 特に、クラウドネイティブ環境におけるセキュリティガバナンスの高度化や、SaaS統合管理 の複雑化が顕著になる中で「Corporate SRE」という新たな専門チームを立ち上げるに至り ました。
SREの知見を全社横断で適用し、組織の信頼性を高める Corporate SRE - 株式会社primeNumber より
11 とか言ってますが「やることが..やることが多い..!!」状態になったため • SREチームの正社員2人(うち1人はEMかつ兼務あり)しかいないのよ〜😭 ◦ (でもついに今度3人目が入ってくれます、やったね!!! • SREの責務が増えてきて1チームで全部見るのはつらい ◦ 「プロダクト」のSREをやりながらAWS
Organization管理など全社利用のモノも見 るのはコンテキストスイッチが激しい (たぶんあるあるだけど) ▪ 組織のサイズが小さいうちはやむなしだけど、100人越えたらそうも言ってられない • 他チーム・部署に移譲できないのか? ◦ 逆にお願いされたり、すでに連携して進めているものも • 最適化するなら、求められるマインドやスキルセットも異なっているはず 👉 チーム分けてポジション作って採用を目指そう!
12 どうSREチームを分割しようとしたか
13 こうしようとしている、のでここに至るまでを話します
14 まずは業務の洗い出し(サクセッションプランニング)からやってみた • エレガントパズル で知ったやつ • 本来は自分の後任を見つける・育成するためのプロセス 自分は何をしているのか?を理解する (リストアップする)ことが第一歩 -
カレンダーを見てミーティングで の役割を書き留める - カレンダーを見てミーティング以 外のことを書き留める - 繰り返し行われてきたプロセス と、そのプロセスにおける役割を 書き留める
15 これを領域に合わせてざっくりマッピング チームを分けるといってもすぐに人を増やせるわけではないので、仮想的にチーム内チーム
16 ちょっと先の展望も考える • 業務委託メンバーへは徐々にCorp SRE領域のタスクをアサインしていくようにする • Corp SRE領域向けのJob Description(≒ 求人、募集要項)を作って採用候補者を探す
◦ Product SRE領域とは求めるマインド・スキルセットが異なるはずなので、別枠に
17 確度は低いがさらに先の展望も考えておく • 「人が取れる」前提になるが完全に分離し、Corp SREはよりSecurity, CorpIT領域との連携を強めて いきたい • マネジメント層の想定などはひとまずpending
18 できあがったのがこちらになります SREの知見を全社横断で適用し、組織の信頼性を高める Corporate SRE - 株式会社primeNumber より
19 Q. なんで “Corporate SRE” なの? A. 誤解やミスマッチをできるだけ減らしたい • セキュリティチームと情シスと連携してる部分を一緒にやる+全社SaaS管理などを想定
◦ 組織の信頼性を高める 〜SRE/情シス/セキュリティの領域を超えて〜の影響が大きい • プロダクトが多くないので、開発組織が分散してない ◦ EmbeddedとPlatformという分け方をすると誤解やミスマッチが起こりそう ▪ 入ったら「ぜんぜんPlatformちゃうやんけ!!!」とぼくならなります、たぶん ◦ AWSとかGoogle Cloudは見てもらうけどCCoEってほどでもないし… • プロダクト領域のSREとコーポレート領域SRE的な分け方をするのがいいのではないか
20 まとめ・所感
21 まとめ・所感 • pN社でSREがなぜ、どう考えてSREチームを分けたかを話してみました ◦ 結果はこれから… ◦ 懇親会でぜひみなさんの話も聞かせてください👂 • 即分割、とはいかないので兆候が見えたら考えはじめてみてもいいかも
• 越境した業務に悩んでる人は組織の信頼性を高める 〜SRE/情シス/セキュリ ティの領域を超えて〜の資料を見るといいぞ! • ポジション作るときはスカウト文や選考フローもセットで考えようね (大慌て した人より)