Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SREチーム立ち上げ3年目、Embeddedやってみた実践と気づき/the practic...
Search
AEON
July 11, 2024
3
2.3k
SREチーム立ち上げ3年目、Embeddedやってみた実践と気づき/the practice of embeddedSRE
Tech Brew in 東京「Embedded SRE 現場に寄り添うアプローチ」(
https://findy.connpass.com/event/323099/
) での発表資料です。
AEON
July 11, 2024
Tweet
Share
More Decks by AEON
See All by AEON
「もしもデータ基盤開発で『強くてニューゲーム』ができたなら今の僕はどんなデータ基盤を作っただろう」
aeonpeople
0
260
It's Automatic〜7回目のベルでアラートを取った君へ〜/ignite-aks-automate
aeonpeople
0
460
"AKSのアップグレードに失敗しない漢"への道/failure-of-upgrade-is-not-an-option
aeonpeople
0
1.2k
Terraformのdrift(差分)を全部AIに任せた!...かった
aeonpeople
0
110
Azureコストと向き合った、4年半のリアル / Four and a half years of dealing with Azure costs
aeonpeople
1
400
Snowflakeで実現したスピード感あるデータ基盤開発 / rapid data infrastructure development achieved with Snowflake
aeonpeople
1
140
プラットフォーム転換期におけるGitHub Copilot活用〜Coding agentがそれを加速するか〜 / Leveraging GitHub Copilot During Platform Transition Periods
aeonpeople
2
620
JTCにおける内製×スクラム開発への挑戦〜内製化率95%達成の舞台裏/JTC's challenge of in-house development with Scrum
aeonpeople
0
650
2025年にHCP Vaultを学び直して見えた景色 / Lessons and New Perspectives from Relearning HCP Vault in 2025
aeonpeople
0
440
Featured
See All Featured
Faster Mobile Websites
deanohume
310
31k
Building an army of robots
kneath
306
46k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
67
We Have a Design System, Now What?
morganepeng
54
7.9k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
120
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
350
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
Amusing Abliteration
ianozsvald
0
76
How GitHub (no longer) Works
holman
316
140k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
0
32
Transcript
SREチーム⽴ち上げ3年⽬、 Embeddedやってみた実践と気づき イオンスマートテクノロジー株式会社 DevSecOps Div. SREチーム 齋藤光 2024年7⽉11⽇ Tech Brew
in 東京「Embedded SRE 現場に寄り添うアプローチ」
自己紹介
⾃⼰紹介 齋藤光( @hikkie13 ) イオンスマートテクノロジー株式会社 DevSecOps Div. SREチーム所属 (2022/5⼊社) SREチームの⽴ち上げをやってきた。
趣味:ヨガ 直近の登壇: SRE NEXT 2023 「エンタープライズ企業でのSRE⽴ち上げ挑戦の際に 意識した事と気付き、現在地とこれから」 CloudNative Days Tokyo 2023 「イオンがKubernetesを採⽤してどうなった?」
会社紹介
会社紹介
iAEONアプリについて 膨⼤なIDと購買データを集約したアプリ「iAEON」 iAEONはイオングループが提供する決済機能やポイントプログラムを1つにまとめたアプリです。 イオングループ内の多数の事業会社がもつ顧客IDを⼀つのアプリに統合しています。
iAEONアプリについて 膨⼤なIDと購買データを集約したアプリ「iAEON」 iAEONはイオングループが提供する決済機能やポイントプログラムを1つにまとめたアプリです。 イオングループ内の多数の事業会社がもつ顧客IDを⼀つのアプリに統合しています。 https://prtimes.jp/main/html/rd/p/000004399.000007505.html
Agenda • ⽴ち上げ時からのSREチームの役割 / Embedded SREモデル採⽤の背景 • 実践してみての気づき
⽴ち上げ時からのSREチームの役割 / Embedded SREモデル採⽤の背景
SREチームにまつわるトポロジー Stream-Aligned Team Platform Team Enabling Team SREチーム https://amzn.asia/d/9e7akXD 2つの側⾯を持ち合わせる
Enabling • Stream-Aligned(SA)チームへSREのインストール • 整備したツール/基盤の伝承と伴⾛ • 定点観測会など定期的にSAチームとcommunication Platform • インフラ基盤⾃体の改善(Azure) • セルフサービスの提供(徐々に拡⼤中) • ツール/基盤の整備
こうなる 情報共有&連携 SREチーム プロダクトA プロダクトB プロダクトD プロダクトC Platform ツール など
課題や要望を⼀般化 Enabling Enabling Enabling Enabling
SREチームにまつわるトポロジー • チーム内のcontext switchの多さ • 改善が進まない / 改善のスピードが期待値より低い領域が発⽣ o SAチームのリソース不⾜
o SAチームのcapability不⾜ o 優先度の考え⽅のすれ違い o 相談/依頼のタイミングではHow/WhatになっておりWhyを掘り起こすところからスタート 以下のつらみや悩みが発⽣
Embeddedモデルの⼀部導⼊へ • 重要、かつ、課題が多いプロダクトに対してのみ o コアなサービス o 改善すべき残課題の重要性(セキュリティ、スケーラビリティなど) • あくまで最終⽬標はSAチーム内でSREの実践が完結すること o
SAチーム内に所属させることは現状選択してしない
実践してみての気づき
Embeddedへの挑戦で意識してやっていること • SAチームが出席するようなプロダクトに関する定例、会議は出席 o SAチームと情報をsync o 案件状況、チームの状態、課題の優先度を把握。⽬線を揃える。 • ⼀緒に課題を解くことで信頼の構築 o
Team Topologiesでのコラボレーションが濃い状態に近いと捉えている • ゴールの状態を忘れない。 o あくまで最終⽬標はSAチーム内でSREの実践が完結すること o SAチーム内でSRE担当に任せっぱなしの状況は作らない。
Embeddedモデルの留意点 • マインドとして、事業/プロダクトへの理解 、愛、熱量はより求められる • 会議は爆発的に増える • 兼務、ダメ、ゼッタイ o やむをえず選択する場合でも、関係性が限りなく近いものを。
• サイロ化への対処 o Platform Engineeringの思想でカバーする。 • スケールは難しい o 全プロダクトに導⼊するには‧‧‧採⽤がネックに。 o 現実的には⼀時的なEmbeddedモデル採⽤が現実的
よくある質問:どのSREモデルを採⽤すべきですか? • プロダクトの重要性、課題を解くのに求められるスピード • SAチームの成熟度 o リソース/capability • SREチームの成熟度 o
弊社の場合は、IaC/Observability基盤など道具⾯を揃える⽅が先だった。 o そもそも⼈が⾜りてなかった。 組織、チーム、プロダクトの状況‧フェーズによる。 組織設計の理想は⼤事だが、組織の解くべき課題‧フローのblockerを解消する体制を適宜 ⾒直しながら選択する。
以下、告知
告知
告知 https://aeon.connpass.com/event/323707/
告知 https://aeon.connpass.com/event/320677/
募集しています!