Upgrade to Pro — share decks privately, control downloads, hide ads and more …

もっとSREを広げるための初学者向け技術研修設計

kesompochy
January 26, 2025
2.1k

 もっとSREを広げるための初学者向け技術研修設計

SRE Kaigi 2025での登壇資料です。30分枠でした。
https://2025.srekaigi.net/#timetable

kesompochy

January 26, 2025
Tweet

Transcript

  1. 14 今⽇話すこと 1. More SRE! - このセッションで扱う題材の導⼊ - 2. ⾃⼰紹介

    3. SREスキル習得の課題 4. GMOペパボの新卒研修 4.1. 概要 4.2. 詳細 4.3. 設計時の考慮事項 5. 新卒研修以外のトレーニング 6. 個⼈的に効果的だった教材 7. まとめ
  2. 15 今⽇話すこと 1. More SRE! - このセッションで扱う題材の導⼊ - 2. ⾃⼰紹介

    3. SREスキル習得の課題 4. GMOペパボの新卒研修 4.1. 概要 4.2. 詳細 4.3. 設計時の考慮事項 5. 新卒研修以外のトレーニング 6. 個⼈的に効果的だった教材 7. まとめ
  3. 16 ⾃⼰紹介 技術部 データ基盤チーム 2022年 新卒⼊社 染⽮ 健⼈ Someya Kento

    GMOペパボでSREingをやっています。 ⼤学⽣のときは⼩中⾼⽣への講師業でお⾦をいただいていました。 好きなアザラシはワモンアザラシです。 • GitHub: @kesompochy • Twitter : @kesompochy • 書いた記事: https://tech.pepabo.com/authors/pochy/
  4. 21 今⽇話すこと 1. More SRE! - このセッションで扱う題材の導⼊ - 2. ⾃⼰紹介

    3. SREスキル習得の課題 4. GMOペパボの新卒研修 4.1. 概要 4.2. 詳細 4.3. 設計時の考慮事項 5. 新卒研修以外のトレーニング 6. 個⼈的に効果的だった教材 7. まとめ
  5. SREスキル習得の課題 23 • SREsに求められるスキルは多岐に渡る ◦ 事業ドメインへの理解 ◦ SLI/SLO策定、運⽤ ◦ モニタリング,

    オブザーバビリティエンジニアリング ◦ パフォーマンスチューニング ◦ ソフトウェアでの運⽤省⼒化 ◦ インシデント管理 ◦ オンコール対応 ◦ セキュリティ ◦ etc.. • どれから習得すべき? SREに求められるスキルの幅広さ
  6. SREスキル習得の課題 28 • いわゆるOJTでは『学習が起こるタイミングが「偶然」に 依存する』 ◦ 中原淳(2014). 『研修開発⼊⾨---会社で「教える」、競争優位を「つくる」』. ダイヤモンド社 •

    SREが成熟に伴い、簡単な課題が発⽣する確率が下がる ◦ いわゆる「good first issue」が枯渇するのでは? ◦ かといって、簡単なタスクを残しておくこともできない ◦ そのため、基礎的なスキルを実務以外で習得しておく必要が⽣まれる SREスキルの学習機会が少ない
  7. 30 今⽇話すこと 1. More SRE! - このセッションで扱う題材の導⼊ - 2. ⾃⼰紹介

    3. SREスキル習得の課題 4. GMOペパボの新卒研修 4.1. 概要 4.2. 詳細 4.3. 設計時の考慮事項 5. 新卒研修以外のトレーニング 6. 個⼈的に効果的だった教材 7. まとめ
  8. GMOペパボの新卒研修 33 「必要となるような知識‧技能‧ 信念を獲得させ、組織適応を果た すプロセス」 中原淳(2021). 『経営学習論: ⼈材育成を科学する』. ⼀般財団法⼈ 東京⼤学出版会

    組織社会化 この組織ではkubectlコマンドを 打てる必要があるのか! この組織には『⾮難なきポスト モーテム』⽂化があるのか!
  9. GMOペパボの事例 -内容- 37 • ⼤まかに次の内容 ◦ コンテナ技術の基本的な考え方 ◦ Linuxカーネルで提供されているプロセス隔離機能やその他コンテナランタイムが利用する機能 ◦

    runcを直接触ったコンテナの起動 ◦ Dockerの使い方、Dockerfileの書き方、本番運用するうえでのプラクティス実践 ◦ GitHub Actionsの使い方、社内で実際に利用されている Actionsをもとにしたハンズオン ◦ Kubernetesクラスタのアーキテクチャ理解、基本的な Workloads APIハンズオン ◦ ArgoCDの使い方 コンテナ研修
  10. GMOペパボの事例 -内容- 39 • ⼤まかに次の内容 ◦ メトリクスを収集、可視化しよう ◦ ログを収集、可視化しよう ◦

    トレースを収集、可視化しよう ◦ 監視、アラートを出しよう ◦ CUJを設定し、CUJが阻害される障害を即座に検知できるようにしよう ◦ ⾃分で壊してその障害を検知できたら、原因をテレメトリーから説明しよう オブザーバビリティ研修
  11. GMOペパボの事例 -内容- 40 • ⼀般社団法⼈⽇本CTO協会が主 催 • catatsuy/private-isu を使わせ ていただいている

    ◦ https://github.com/catatsuy/private-isu パフォーマンスチューニング実践 https://tech.pepabo.com/2024/02/16/isucon-2023/ に詳しく説明されている
  12. GMOペパボの事例 -設計- 42 • 教室で座学を受けるか、実戦を⽣き残って糧を得るか ◦ 後者はいわゆる「⾕底に突き落とす」やり⽅ • 教育⾔説は『この⼆つの間を「揺れる振り⼦」のよう に動き続けてきた』

    ◦ 中原淳(2014). 『研修開発⼊⾨---会社で「教える」、競争優位を「つくる」』. ダイヤモンド社 ◦ ⽬的に応じて取り⼊れたい 座学 vs 実践
  13. GMOペパボの事例 -設計- 43 • 具体的短期的な技能と抽象的⻑期的な技能 ◦ たとえば「kubectlでクラスタ操作ができる」と 「k8sがどのような課題を解決するのか説明できる」 • 両⽅習得したい

    ◦ システムを作り上げるには具体的な技能が必要だし、 システムを時間の経過に耐えさせるには適切な抽象化が必要 How vs Why
  14. GMOペパボの事例 -設計- 45 • 必要な知識は⽂書化して置いておく ◦ 必要になったら参照する⽅式 ◦ Dockerfileの例など •

    ペパボでは「アウトプットすること」 を重視 ◦ 成果物の解説を課題として設定する ▪ 右図は実際の成果物解説時に作られた資料の⼀部 ◦ ⼈に伝わるように出⼒することで習得が深まる 座学は⼀瞬、ほとんどの時間は実践
  15. GMOペパボの事例 -レポーティング- 66 • 座学と実践のバランス ◦ ⽣成AIサービスでどうにかなるはずと思い、実践を多めにした ◦ 「Grafanaの使い⽅に⼾惑った」という感想を得られた ▪

    暗黙知を減らす⽬的のはずが、暗黙的に察する場を提供してしまった ▪ コマンドやクエリの⽣成は得意だが、GUIの操作指⽰は不得意であることを失念していた • 実践時間の⾒積もりが難しい ◦ 「もうちょっとやりたかった」 ▪ ⽤意した実践課題量に対して時間(2.5⽇)が少なかった 得られた課題
  16. 67 今⽇話すこと 1. More SRE! - このセッションで扱う題材の導⼊ - 2. ⾃⼰紹介

    3. SREスキル習得の課題 4. GMOペパボの新卒研修 4.1. 概要 4.2. 詳細 4.3. 設計時の考慮事項 5. 新卒研修以外のトレーニング 6. 個⼈的に効果的だった教材 7. まとめ
  17. 新卒研修以外のトレーニング 69 • 検証環境でkubectlを叩いてみる、など ◦ 実務で必要になるツールの導入 ◦ 認証情報の取得などサービスごとに独特なものを 同期的にやりとりすることで素早く解決する ◦

    音声で会話しながらSlackでコマンドをやりとりする ▪ コマンドをコピペできるので便利 • →は検証環境を作って壊してみるハンズオ ンをやった時のログの一部 ◦ 案の定認証でつまづいた ハンズオン
  18. 新卒研修以外のトレーニング 70 • 障害対応後は、オンボーディング者が システムへの理解を深めるチャンス ◦ 「なぜここでこの対応をしたの?」と聞いたり ◦ チャットログからコマンドを シャドウイングしたり

    ポストモーテム ポストモーテムを含むペパボのインシデント管理については https://speakerdeck.com/hiboma/insidentoresuponsuwozi-don g-hua-dezhi-yuan-suru-slack-bot-deren-ji-ti-nasekiyuriteidui-c e-woshi-xian-suru に詳しく説明されている
  19. 72 今⽇話すこと 1. More SRE! - このセッションで扱う題材の導⼊ - 2. ⾃⼰紹介

    3. SREスキル習得の課題 4. GMOペパボの新卒研修 4.1. 概要 4.2. 詳細 4.3. 設計時の考慮事項 5. 新卒研修以外のトレーニング 6. 個⼈的に効果的だった教材 7. まとめ
  20. 個⼈的に効果的だった教材 74 書籍 株式会社GGトップ『SRE サイトリライアビリティエンジニアリングが”ザックリ” 「すっき り」 分かる本: Googleが実践している新DevOps⽅法論』 •

    いわゆる「SRE本」をやさしくしたような内容 • ページ数は多くないので業務時間中に通読できる • 新卒⼊社時にSREの考え⽅を⾃分に導⼊するのに 助かった
  21. 個⼈的に効果的だった教材 75 ワークショップ『the Art of SLOs』 • SLI, SLOを策定する演習がメインのワークショップ •

    Googleによって資料が公開されている ◦ ライセンスは「クリエイティブ‧コモンズ CC-BY-4.0 ライセンス」 ◦ https://sre.google/intl/ALL_jp/resources/practices-and-processes/art-of-slos/ • 私はワークショップを受けていないが、資料を通読することで SLI/SLO運⽤が実践できた気持ちになれた
  22. 個⼈的に効果的だった教材 76 ⾃宅サーバー • 「ミニPCおすすめだよ〜」と社内の先輩に⾔われたので買った • 次の作業をやった ◦ すでに⼊っているWindowsを消し⾶ばしてUbuntuを⼊れる ◦

    ネットワークにつないで他の端末からsshできるようにする ◦ nginxを⽴てたりして遊ぶ ◦ いつの間にかミニPCが⾃宅で繁殖していたのでk8sクラスタにした • やはり実践は強⼒ • 同じような経験が社内研修でできないかを考えている...
  23. 77 今⽇話すこと 1. More SRE! - このセッションで扱う題材の導⼊ - 2. ⾃⼰紹介

    3. SREスキル習得の課題 4. GMOペパボの新卒研修 4.1. 概要 4.2. 詳細 4.3. 設計時の考慮事項 5. 新卒研修以外のトレーニング 6. 個⼈的に効果的だった教材 7. まとめ