Upgrade to Pro — share decks privately, control downloads, hide ads and more …

信頼性の階層の一段目を積み上げる/Monitoring Dashboard

信頼性の階層の一段目を積み上げる/Monitoring Dashboard

shonansurvivors

May 20, 2022
Tweet

More Decks by shonansurvivors

Other Decks in Technology

Transcript

  1. 自己紹介 株式会社スマートラウンド SRE 山原 崇史 (やまはら たかし) 経歴  SIer・銀行・Web系ベンチャー →

    スマートラウンド 好きなAWSサービス  AWS SSO / Organizations / Control Tower / Security Hub Twitter  @shonansurvivors
  2. 会社概要 社名  株式会社スマートラウンド 代表者  砂川 大 設立  2018年5月 従業員数  約25名

    本社住所  東京都渋谷区 ※バーチャルオフィスで全員フルリモート ホームページ  https://jp.smartround.com (サービスLP)
  3. アジェンダ 1. 信頼性の階層とモニタリング 2. モニタリングのインターフェース ◦ アラート ◦ 可視化 3.

    ダッシュボードと4大シグナル 4. CloudWatchダッシュボードによる実装 5. まとめ
  4. 2. モニタリングのインターフェース 大きく以下2つが考えられ、今回は 後者に着目 インターフェース 実現したいこと 実装 アラート(警告) ・人間にアクションをうながす ・Slack等のチャットシステム

    ・インシデント管理システム 可視化 ・主要メトリクスを鮮度高く把握 ・長期的なトレンドの分析 ・何らかの切り口での 比較(時間帯など) ・グラフ等の各種チャート ・それらを集約したダッシュボード
  5. 3. ダッシュボードと4大シグナル SRE本によると、ダッシュボードは通常 4大シグナルを含む • レイテンシ ◦ リクエストを処理してレスポンスを返すまでにかかる時間 • トラフィック

    ◦ システムに対するリクエストの量 • エラー ◦ 処理に失敗したリクエストの率 • サチュレーション(飽和) ◦ サービスがどれだけ「手一杯」になっているかを示す https://sre.google/sre-book/monitoring-distributed-systems/
  6. 5. まとめ • 信頼性の階層の最も基本は モニタリング • モニタリング ◦ アラート(警告) ◦

    可視化 ▪ 主要メトリクスを鮮度高く把握 / トレンド分析 / 様々な切り口での比較 • 4大シグナル ◦ レイテンシ / トラフィック / エラー / サチュレーション(飽和) • CloudWatch Dashboard ◦ 手軽に可視化を始められる ◦ コード化されていてIaC未導入でも複製が容易 ◦ ダークモードあり