Upgrade to Pro — share decks privately, control downloads, hide ads and more …

フィットする暮らしを支えるSRE 2021

Avatar for ryosukes ryosukes
February 17, 2021

フィットする暮らしを支えるSRE 2021

株式会社クラシコムの社内勉強会 Monthly Hygge
2021年1月29日発表時の資料

Avatar for ryosukes

ryosukes

February 17, 2021
Tweet

More Decks by ryosukes

Other Decks in Programming

Transcript

  1. 5

  2. SREって? - Site Reliability Engineeringの略 - Googleで培われたシステム管理とサービス運用の方法論 - サイトの信頼性を高め、サービスの収益・ブランドを支える役割 -

    定常業務、インフラ構築、障害管理、パフォーマンス管理などの自動化・ 自律化の仕組み整備をソフトウェア開発を通して行う 6
  3. 2020年を振り返る① - 負荷試験・キャパシティプランニング - パフォーマンスチェックと改善 - 試験手法のラーニング - AWSのアカウントまわり見直し -

    AWSのマルチアカウント化 - 本番とその他用途の環境の分離による事故防止 - セキュリティの向上 - IAMユーザー・ロールなど権限管理の効率化 10
  4. 2020年を振り返る② - Infrastructure as Code(Terraform, ecspressoなど) - バージョン管理 - ブラックボックス解消

    - レビューしやすく品質も向上 - コンテナ技術(ECS/Docker)への移行 - 状態を持たないため安定稼働する - 他エンジニアへの権限移譲 - 開発のしやすさ、開発速度の向上 11
  5. 2020年を振り返る③ - モニタリングツール活用(Mackerel, Datadog...etc) - 問題の早期発見 - 障害対応の迅速化 - ログ管理の整備(Logentries

    → CWL移行) - 調査スピードの改善 - ログの種類を増やしやすくした - DBをRDSからAuroraへ - パフォーマンス改善(最大MySQLの5倍の処理速度) - データ消失リスクの軽減 - 高速フェイルオーバー 12