Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Prometheusでの監視データ活用マニュアル

kameneko
April 17, 2023

 Prometheusでの監視データ活用マニュアル

2023/04/17 開催された、Kubernetes Novice Tokyo #24 にて話したスライドです。
https://k8s-novice-jp.connpass.com/event/278196/

kameneko

April 17, 2023
Tweet

More Decks by kameneko

Other Decks in Technology

Transcript

  1. Prometheusとは • オープンソースの監視システム • 時系列データベースを採用したPull型データモデルを採用 • ServiceDiscoveryによるターゲットの自動追従 • PromQLによるシンプルかつ柔軟なクエリ •

    さまざまなソフトウェアに対応したExporter • Kubernetesを始めとしたクラウドネイティブな監視 • Observabilityを実現 • Observabilityを実現
  2. Prometheusとは • オープンソースの監視システム • 時系列データベースを採用したPull型データモデルを採用 • ServiceDiscoveryによるターゲットの自動追従 • PromQLによるシンプルかつ柔軟なクエリ •

    さまざまなソフトウェアに対応したExporter • Kubernetesを始めとしたクラウドネイティブな監視 • Observabilityを実現 • Observabilityを実現
  3. データを活用する 1. 収集 2. 通知 3. 可視化 4. 分析 Exporterの活用

    • Prometheusには公式非公式含めて多種多様なExporterが存在 • システムが利用している各種Exporterを使って簡単にメトリクスを収集 なければ作る • 大抵のソフトウェアは公開されているExporterで対応可能だが ソフトウェアが対応していない・更新されていないExporterなど… • 自前のアプリケーションも同様 • これらは自分で「Exporterを作る」or「組み込む」
  4. データを活用する 1. 収集 2. 通知 3. 可視化 4. 分析 SLOベースのアラート

    • 「サービス状態」をベースにした考え • SLOを基準とすることでサービス品質に紐づいたアラートが可能 Runbookの活用 • Runbook: 運用手順をまとめたドキュメント • 通知するだけでなく、通知したあとの動きも考慮する • 通知にRunbookを埋め込み、通知を受けたあとの行動も明確に
  5. データを活用する 1. 収集 2. 通知 3. 可視化 4. 分析 コミュニティのダッシュボードを活用

    • さまざまなコンポーネントのダッシュボードをメンテするのは大変 • 汎用的なダッシュボード(Linuxサーバの情報など)は コミュニティのダッシュボードをお借りする サービスに関するダッシュボードは自作 • 実際に作成するのはサービスに関わるもの • 常に利用し、メンテナンスする
  6. データを活用する 1. 収集 2. 通知 3. 可視化 4. 分析 開発者もPrometheusを

    • Prometheusはインフラのためのツールのように見えるが 開発者にとっても重要 • 開発者が必要なメトリクスを取得する サービス品質向上のために • システム運用だけでなく、ビジネスのためにメトリクスを使う • 「サービス別の利用率」「利用率の高い時間帯」「ユーザの行動」 • メトリクスだけでもさまざまな指標が取得できる • +α ログやトレーシングを合わせるとよりよい