Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SREチーム立ち上げ3年目、Embeddedやってみた実践と気づき/the practic...
Search
AEON
July 11, 2024
3
2.3k
SREチーム立ち上げ3年目、Embeddedやってみた実践と気づき/the practice of embeddedSRE
Tech Brew in 東京「Embedded SRE 現場に寄り添うアプローチ」(
https://findy.connpass.com/event/323099/
) での発表資料です。
AEON
July 11, 2024
Tweet
Share
More Decks by AEON
See All by AEON
プラットフォーム転換期におけるGitHub Copilot活用〜Coding agentがそれを加速するか〜 / Leveraging GitHub Copilot During Platform Transition Periods
aeonpeople
1
240
JTCにおける内製×スクラム開発への挑戦〜内製化率95%達成の舞台裏/JTC's challenge of in-house development with Scrum
aeonpeople
0
270
2025年にHCP Vaultを学び直して見えた景色 / Lessons and New Perspectives from Relearning HCP Vault in 2025
aeonpeople
0
250
イオン店舗一覧ページのパフォーマンスチューニング事例 / Performance tuning example for AEON store list page
aeonpeople
2
450
会社もクラウドも違うけど 通じたコスト削減テクニック/Cost optimization strategies effective regardless of company or cloud provider
aeonpeople
2
630
SREがコストセンターではないことを大きな声と実例で伝えたい/SRE Is Not a Cost Center: Real-World Stories That Prove True Value
aeonpeople
1
910
SREチームの越境と対話〜どのようにしてイオンスマートテクノロジーは横軸運用チームの廃止に至ったか〜/the-Cross-border-and-dialogue-of-SRE
aeonpeople
13
7.5k
PagerDuty×ポストモーテムで築く障害対応文化/Building a culture of incident response with PagerDuty and postmortems
aeonpeople
3
830
【内製開発Summit 2025】イオンスマートテクノロジーの内製化組織の作り方/In-house-development-summit-AST
aeonpeople
2
2.8k
Featured
See All Featured
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
31
2.2k
Building Applications with DynamoDB
mza
96
6.6k
Unsuck your backbone
ammeep
671
58k
Writing Fast Ruby
sferik
628
62k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
4 Signs Your Business is Dying
shpigford
184
22k
Documentation Writing (for coders)
carmenintech
74
5k
It's Worth the Effort
3n
187
28k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
The Power of CSS Pseudo Elements
geoffreycrofte
77
6k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.9k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
810
Transcript
SREチーム⽴ち上げ3年⽬、 Embeddedやってみた実践と気づき イオンスマートテクノロジー株式会社 DevSecOps Div. SREチーム 齋藤光 2024年7⽉11⽇ Tech Brew
in 東京「Embedded SRE 現場に寄り添うアプローチ」
自己紹介
⾃⼰紹介 齋藤光( @hikkie13 ) イオンスマートテクノロジー株式会社 DevSecOps Div. SREチーム所属 (2022/5⼊社) SREチームの⽴ち上げをやってきた。
趣味:ヨガ 直近の登壇: SRE NEXT 2023 「エンタープライズ企業でのSRE⽴ち上げ挑戦の際に 意識した事と気付き、現在地とこれから」 CloudNative Days Tokyo 2023 「イオンがKubernetesを採⽤してどうなった?」
会社紹介
会社紹介
iAEONアプリについて 膨⼤なIDと購買データを集約したアプリ「iAEON」 iAEONはイオングループが提供する決済機能やポイントプログラムを1つにまとめたアプリです。 イオングループ内の多数の事業会社がもつ顧客IDを⼀つのアプリに統合しています。
iAEONアプリについて 膨⼤なIDと購買データを集約したアプリ「iAEON」 iAEONはイオングループが提供する決済機能やポイントプログラムを1つにまとめたアプリです。 イオングループ内の多数の事業会社がもつ顧客IDを⼀つのアプリに統合しています。 https://prtimes.jp/main/html/rd/p/000004399.000007505.html
Agenda • ⽴ち上げ時からのSREチームの役割 / Embedded SREモデル採⽤の背景 • 実践してみての気づき
⽴ち上げ時からのSREチームの役割 / Embedded SREモデル採⽤の背景
SREチームにまつわるトポロジー Stream-Aligned Team Platform Team Enabling Team SREチーム https://amzn.asia/d/9e7akXD 2つの側⾯を持ち合わせる
Enabling • Stream-Aligned(SA)チームへSREのインストール • 整備したツール/基盤の伝承と伴⾛ • 定点観測会など定期的にSAチームとcommunication Platform • インフラ基盤⾃体の改善(Azure) • セルフサービスの提供(徐々に拡⼤中) • ツール/基盤の整備
こうなる 情報共有&連携 SREチーム プロダクトA プロダクトB プロダクトD プロダクトC Platform ツール など
課題や要望を⼀般化 Enabling Enabling Enabling Enabling
SREチームにまつわるトポロジー • チーム内のcontext switchの多さ • 改善が進まない / 改善のスピードが期待値より低い領域が発⽣ o SAチームのリソース不⾜
o SAチームのcapability不⾜ o 優先度の考え⽅のすれ違い o 相談/依頼のタイミングではHow/WhatになっておりWhyを掘り起こすところからスタート 以下のつらみや悩みが発⽣
Embeddedモデルの⼀部導⼊へ • 重要、かつ、課題が多いプロダクトに対してのみ o コアなサービス o 改善すべき残課題の重要性(セキュリティ、スケーラビリティなど) • あくまで最終⽬標はSAチーム内でSREの実践が完結すること o
SAチーム内に所属させることは現状選択してしない
実践してみての気づき
Embeddedへの挑戦で意識してやっていること • SAチームが出席するようなプロダクトに関する定例、会議は出席 o SAチームと情報をsync o 案件状況、チームの状態、課題の優先度を把握。⽬線を揃える。 • ⼀緒に課題を解くことで信頼の構築 o
Team Topologiesでのコラボレーションが濃い状態に近いと捉えている • ゴールの状態を忘れない。 o あくまで最終⽬標はSAチーム内でSREの実践が完結すること o SAチーム内でSRE担当に任せっぱなしの状況は作らない。
Embeddedモデルの留意点 • マインドとして、事業/プロダクトへの理解 、愛、熱量はより求められる • 会議は爆発的に増える • 兼務、ダメ、ゼッタイ o やむをえず選択する場合でも、関係性が限りなく近いものを。
• サイロ化への対処 o Platform Engineeringの思想でカバーする。 • スケールは難しい o 全プロダクトに導⼊するには‧‧‧採⽤がネックに。 o 現実的には⼀時的なEmbeddedモデル採⽤が現実的
よくある質問:どのSREモデルを採⽤すべきですか? • プロダクトの重要性、課題を解くのに求められるスピード • SAチームの成熟度 o リソース/capability • SREチームの成熟度 o
弊社の場合は、IaC/Observability基盤など道具⾯を揃える⽅が先だった。 o そもそも⼈が⾜りてなかった。 組織、チーム、プロダクトの状況‧フェーズによる。 組織設計の理想は⼤事だが、組織の解くべき課題‧フローのblockerを解消する体制を適宜 ⾒直しながら選択する。
以下、告知
告知
告知 https://aeon.connpass.com/event/323707/
告知 https://aeon.connpass.com/event/320677/
募集しています!