Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ワークロードを処理しないプラットフォームに専念する

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for maru maru
September 17, 2025
790

 ワークロードを処理しないプラットフォームに専念する

Avatar for maru

maru

September 17, 2025
Tweet

Transcript

  1. © LY Corporation © LY Corporation Public 「ワークロードを処理しないプラットフォーム」とは? この発表では、以下のような区別をしています。 ワークロードを処理する

    Kubernetesクラスタ CI/CDのためのツール(タスクランナーやワークフローエンジン) その他、開発者やエンドユーザーのためのリアルタイム処理を必要とするもの ワークロードを処理しない ドキュメント 便利なCLI その他、利用する際にスタンドアロンで動くもの 2 / 25
  2. © LY Corporation © LY Corporation Public この発表で扱う内容 組織構造と働き方の観点からのプラットフォームチーム事例 プラットフォームを支援する

    Embedded / Enabling 型のアプローチとその成果 Embedded SRE in 横断組織のチームを運営する上でのリアルな苦悩 開発者ポータル構築やKubernetesなどの特定技術は扱いません 3 / 25
  3. © LY Corporation © LY Corporation Public 自己紹介 @maru 2020:

    LINEに入社(LINEスタンプ/着せかえ/タブのSRE) 2022: LYPプレミアム立ち上げSRE 2023: 新サービス立ち上げSRE 常にプロダクト開発のSREとして、開発チームと綿密にやりとり。 4 / 25
  4. © LY Corporation © LY Corporation Public この発表で使う用語の解説 主にTeam Topologiesの用語で説明します。

    用語 説明 コラボレーション 相手チームと密接に協力する。まるで1つのチームのように振る舞う。 ファシリテーション 相手チームが持っていない知見や技術を導入・支援する。 コンサルタントやエヴァンジェリストに近い。 XaaS サービス・責任境界を明確にし、複数チームに低コストで横展開する。 5 / 25
  5. © LY Corporation © LY Corporation Public SREチームの成り立ち 私たちは元々は事業部の Embedded

    SREチーム 1プロダクト × 1SREで、開発者と一緒に改善していくコラボレーション型 企画担当者との会議にも同席し、新機能の仕様決定からSREとして参加する リリースやオンコールの輪番も開発チームに混じる 信頼性に関わるイシューを一緒に開発していく中で発見して改善する 2年前、これまでの活動が評価され、横断部署に異動 「もっと広い貢献」を求められる 6 / 25
  6. © LY Corporation © LY Corporation Public 私たちの強みと「もっと広い貢献」のギャップ 私たちの強み プロダクトと開発チームの両方に解像度が高い

    1つのプロダクトに専任している 課題をヒアリングするのではなく、独自に課題を発見して解決の提案をする 1プロダクトにSREは1人だけ 勝手に改善することはできず、改善するためにも開発チームとの相談が必須 = 開発チームを置き去りにしない 広く貢献するためには...? 1プロダクト × 1SREのコラボレーションはスケールできない... 他のプラットフォームと同じようにXaaSにすると、私たちの強みが失われる... 7 / 25
  7. © LY Corporation © LY Corporation Public Train the Trainerによるスケーラビリティ改善

    開発チーム内に育成メンバー(準SRE)を育成し、プラクティスを波紋のように伝播させる構想 SREs → 開発チームA → 開発チームB → 開発チームC... ある程度効果はあるが... 成果の可視化がしにくく、評価が難しい 効力が開発チームの活動に依存しすぎている 8 / 25
  8. © LY Corporation © LY Corporation Public 方向転換:Embedded + Enabling

    Train the Trainerは継続しつつも、チームの効力をそれだけに依存しないために 2つの取り組みをループさせる。 種類 期限 関わり方 コラボレーション (Embedded) 無期限 プロダクトチームに深く入り込む。 チーム文化・プロダクトの改善をしつつ、小さな成功事例を作る ファシリテーション (Enabling) 2-4週間 上記の小さな成功をパターン化し横展開。 同じイシューを抱える他チームの改善をサポート 9 / 25
  9. © LY Corporation © LY Corporation Public Embedded + Enabling

    -> Feedback to プラットフォーム 成功事例をパターン化する際、プラットフォームによる制約にぶつかることがある 自然とプラットフォームチームへのフィードバックも増える 成功事例の「パターン化&移植」によるチームのスケーラビリティの改善 より多くのサービスとの接点を確保 フィードバックの質向上 → プラットフォーム改善が加速 10 / 25
  10. © LY Corporation © LY Corporation Public プラットフォームへのフィードバックの例 複数の開発チームの具体的な課題と機能要望を伝える 開発者にとってわかりにくいドキュメントの修正や図の作成

    プラットフォームのコードへのコントリビューション プラットフォームを中心としたエコシステムの開発 Terraform対応のためのTerraform Providerの開発 生成AI対応のためのMCPサーバーの開発 11 / 25
  11. © LY Corporation © LY Corporation Public この取り組みの理論的・体系的な位置づけ Team Topologiesにおける組織的センシングの実装になっていた。

    すばやく行動するには、環境に関するフィードバックセン サーが必要だ。(中略)このフィードバックセンサーの重要 な側面は、IT運用部門のチームを開発部門のチームのた めの高精度な入力センサーとして使用することだ。 (中 略)いわゆる「保守」作業のコストを最小限に抑えるため の最適化に取り組むのではなく、保守作業からのシグナル をソフトウェア開発稼働への入力として使用することが 重要だ。 引用: Chapter 8 組織的センシングでチーム構造を進化させる 13 / 25
  12. © LY Corporation © LY Corporation Public プラットフォームからEmbeddedへ このフィードバックが増えていくと、プラットフォームのPoCやドッグフーディングで協力できるよ うになる。

    四方良し コラボレーション先:「チームに入って、実際に手を動かして改善してくれる」 ファシリテーション先:「課題解決のために他チームの成功事例を整理して支援してくれる」 プラットフォーム:「フィードバック&コントリビューションしてくれる」 私たち:「コラボレーションを強みにしつつ、スケーラビリティを確保できる」 14 / 25
  13. © LY Corporation © LY Corporation Public 実際には苦悩もいろいろ… プラットフォーム開発の誘惑 個人成果の評価の難しさ

    チーム活動の可視化とナレッジ継承 リーダー育成のジレンマ 長期休暇時のサポート体制 16 / 25
  14. © LY Corporation © LY Corporation Public 苦悩①: プラットフォーム開発の誘惑 目の前の課題を解決するために「プラットフォームを持ちたくなる」

    しかし一度持つと、四方良しの根源であるフットワークの軽さを失う 移行・アップグレード・サポート・etcの運用負担が無視できなくなる 新しいツールを導入したくなった時は? 以下のどちらかにする必要がある プロダクト開発チームがメンテナンスできる、サイロなツールとして導入 プラットフォームチームがXaaSとしてサービス化 日頃からプロダクト開発・プラットフォームとの期待値調整が重要 17 / 25
  15. © LY Corporation © LY Corporation Public 苦悩②: 個人成果の評価 チームを持続するためには貢献と成果を説明する必要がある

    Embedded + Enablingは個人技中心 → 成果が見えにくい 工夫 ステークホルダーからのフィードバックをもらう 半年に一度の360度評価 コラボレーション先のマネージャーと定期1on1 個人評価の評価軸を 「時間方向の改善 × 空間方向な改善」の二軸 で設定 Embedded先での貢献を 時間方向の改善 と定義 Enablingによる成功パターンの横展開を 空間方向の改善 と定義 18 / 25
  16. © LY Corporation © LY Corporation Public 二軸の定義 時間方向の改善(Embedded) 無期限で担当プロダクトに深く入り込み、時間とともに信頼性を改善

    例: SLO導入、運用プロセス改善、リリース安定化 空間方向の改善(Enabling) 成功パターンを整理し、短期間で他チームに横展開 例: SLOワークショップを標準メニュー化して複数チームに提供 最低限満たすゴールは常に時間方向(Embedded)の改善、その先に空間方向(Enabling)。 実務に根ざした改善を確保し、机上の助言だけに終わらないようにする。 19 / 25
  17. © LY Corporation © LY Corporation Public 苦悩③: チーム内の業務可視化とオンボーディング 個人技故に「それぞれのメンバーが何をやっているのかわからない」問題

    属人性が強く、新メンバーの習熟が難しい 工夫 必要経費として、チーム内共有に時間を割く 毎日1時間 sync-up meetingを行い、余った時間をmob code reviewに費やす 「ワークロードのあるプラットフォームを持たない」という制約を繰り返し強調 運用が必要なプラットフォームを持ち始めると、属人性の問題が致命的になる 新メンバーは必ず既存メンバーとBuddyを組む 私たちの活動哲学は独特なため、文化的に馴染むための時間が必要 20 / 25
  18. © LY Corporation © LY Corporation Public 苦悩④: リーダー育成のジレンマ メンバーは特定プロダクト内で深く狭い経験になりがち

    リーダーには、今回紹介したような構造を変えるための広い視点・越境経験が求められる = メンバーとリーダーで求められる知識・技能が大きく異なる 工夫 私たちの取り組みをメタ的なプラットフォームとして、XaaSの形で提供する それぞれのサービスをリーダー育成の場にする 21 / 25
  19. © LY Corporation © LY Corporation Public メタ的なプラットフォームとしてのSRE活動 XaaSとして提供するSREサービス 今までやっていたコラボレーションも一つのサービス

    ファシリテーションも短期提供のサービス 各Enablingサービスごとにオーナーを任命し、リーダー候補の育成 オーナー(次期リーダー)の主な仕事 Embedded(コラボレーション)先での小さな成功のパターン化 適用先のチームを見つけるための社内マーケティング そのパターンを他チームに適用するためのエヴァンジェリストとして活動 必要に応じてプラットフォームへフィードバック&コントリビューション 他SREメンバーをその分野のエヴァンジェリストとして教育 22 / 25
  20. © LY Corporation © LY Corporation Public SREプラットフォームのサービスメニュー例 サービス オーナー

    期間 サービス内容 SRE Embedded Service Maru 無期限 SREがチームに参加して、信頼性の改善を行う CUJ/SLI/SLO Bootstrap Alice 4週間 CUJやSLIのワークショップ実施。 定期レビュー会議の設計と引き継ぎまで Infrastructure as Code Alice 4週間 インフラをコード管理するための準備。 ハンズオンセッションも開催 Alert Rules as Code Bob 4週間 アラートルールをコード管理するための準備。 ハンズオンセッションも開催 Kubernetes hands-on Bob 2時間 Kubernetesを学ぶセッションの開催 Terraform hands-on Bob 2時間 Terraformを学ぶセッションの開催 23 / 25
  21. © LY Corporation © LY Corporation Public 苦悩⑤: 長期休暇中のサポート継続 個人技への依存度が高いため、SRE一人が長期休暇に入った場合のサポートが課題になる

    Embedded(コラボレーション)先 原則:開発チーム側が自分たちで対応、足りない部分を他SREsが兼務的にサポート 日頃から、一緒に開発をすることでSRE依存を軽減するように注意している Enabling(ファシリテーション)先 Enablingサービスのオーナーが、サービスレベルに応じて考える これ自体がリーダー育成の一環 原則: SREチーム内教育・知識移転 によって、SREチーム内で誰かが代わりに行う 24 / 25
  22. © LY Corporation © LY Corporation Public 一言でまとめると Embedded →

    Enabling → プラットフォーム → Embeddedで四方良しを実現 Team Topologiesでいうところのセンサー組織の実装例 成功のパターン化と移植、そして評価と成果の可視化で継続可能に ワークロードがあるプラットフォームを持たない勇気が強みになることもある 「ワークロードを持たないから動ける。動けるから広げられる。 」 “ “ 25 / 25