$30 off During Our Annual Pro Sale. View Details »

AWS re:Invent 2025で見たGrafana最新機能の紹介

AWS re:Invent 2025で見たGrafana最新機能の紹介

AWS re:Invent 2025のGrafana Labsブースで聞いた最新機能を紹介するLT資料です。

・Adaptive Telemetry
・LLMを活用してダッシュボード作成やインシデント対応を支援する「Grafana Assistant」
・Grafana CloudとOSS版の機能差分の解説

Avatar for 濱田孝治

濱田孝治

December 11, 2025
Tweet

More Decks by 濱田孝治

Other Decks in Technology

Transcript

  1. 2 濱田孝治(ハマコー) 製造ビジネステクノロジー部 マネージャー • 独立系SIerを経て2017年9月 クラスメソッド入社 ブログ, SNS •

    「クラスメソッド 濱田」で検索 • はてなブックマーク累計 約15,000個 • Xアカウント:@hamako9999 コミュニティ運営 • JAWS-UG コンテナ支部運営 • Grafana Meetup Co-organizer, Grafana Champion! AWS認定関連 • 取得済みAWS認定:SAP, DOP, DBS, SOA, SAA, DVA, SCS, CLF, AIF, MLA, MLS • AWS APN Ambassador 2020, Top Engineer 2025, Community Builder 2025 執筆書籍 • みんなのAWS • SoftwareDesign 2022年11月号 コンテナ特集
  2. 12 Adaptive Telemetry の主要機能 2023年 • Adaptive Metrics(メトリクスの最適化) • Adaptive

    Logs(ログの最適化) 2025年10月8日 一般提供開始 • Adaptive Traces(トレースの最適化) 2025年10月8日 Private Preview 開始 • Adaptive Profiles(プロファイルの最適化)
  3. 14 不要なメトリクスの特定 • 一番上の loki_write_request_... というメトリクスに注目 • 13,000 (13.0K) シリーズ

    データが発生しているが、実際はほとんど使わ れていない • 右側の『Recommendation impact』にある通り、ワンクリックで 13,000シリーズ分のコストを削減
  4. 16 障害の主要原因をタイムラインで追う • システム全体で何が起きているかを時系列で可視化 • 画面中央のタイムラインを見ると、frontend サービスで大きな障害 (Failure/Error)が起きていることを示していて、います。その下にあ る productcatalogservice

    など、依存関係にあるサービスの状態も判別可 能 • 通常なら、各サービスのログを個別に検索して突き合わせる作業が必要だ が、ここでは全てのサービスの異常検知(Anomaly)やエラーが1つのタ イムラインに統合
  5. 18 AIを利用した原因究明 • frontend の赤いエラー部分をクリック • 詳細画面を開くと、具体的に何が閾値を超えているのか(Breach)がリス トアップされ、右側の赤いバーが続いている時間帯が、障害が継続してい る期間 •

    Adaptive Telemetry で無駄なノイズデータは削減しつつも、障害対応に 必要な重要なシグナルはしっかり残っている • AI(SiftやAsserts)の利用で、このように正確に原因箇所を特定できる
  6. 22 Grafana Assistant とは Grafana Assistantは、Grafana Cloudに専用のLLMを組み込んだもので、オ ペレーター、開発者、SREがインシデントのトラブルシューティング、ダッ シュボード管理、製品に関する質問への回答を数分で行えるようにします。 Grafana

    Assistantは、Grafanaインターフェース内で直接インテリジェント でコンテキストを意識したヘルプを提供するエージェント型LLM統合です。 一般的なワークフローを効率化し、質問に答え、オブザーバビリティデータ を最大限に活用できるよう支援します。
  7. 27 ダッシュボードの作成も可能 プレス機に関するデータがリアルタイムで取得できるので、ダッシュボー ドを作ってください。 このダッシュボードは保全用に使用します。 - データソースはまだないので、モックとしてランダムデータソースを使 ってください。それぞれが取るデータの範囲、可視化方法は以下に明示し ます。 -

    サイクルタイム。単位は秒。データの範囲は10~15秒。 - 最大プレス圧力。単位はトン。データの範囲は90~110トン。 - 金型温度。単位は℃。データ範囲は10~100℃。 - 周囲温度。単位は℃。データ範囲は10~40℃。 - 周囲湿度。単位は%。データ範囲は10~70%。 - 振動加速度。単位はm/s2。データ範囲は0.01~0.1。 - モーター電流値。単位はA。データ範囲は30~80A。 - 騒音レベル。単位はdB。範囲は60~80db。 それぞれ適切なデータ可視化の方法を提案して、それぞれ独立したパネル にしてください。 周囲温度、湿度は最新の値だけ可視化できれば良いです。
  8. 34 Amazon Managed Grafanaは? 基本的には、Grafana OSS版のAWSマネージドホスト機能として理解するのが良い(各種アシ スタントやAI/ML機能はなし)。 以下の部分はManaged Grafanaのメリット •

    Amazon CloudWatch logs/metrics、AWS X-Ray traces等とのネイティブ統合 amazon • AWS IAM Identity CenterやSAML 2.0による認証統合 amazon • VPCエンドポイントによるプライベート接続 amazon • Enterpriseプラグインアップグレードにより、ServiceNow、Splunk、Datadog、 Dynatrace等のサードパーティデータソースにも接続可能 ただ、Versionが古かったり(2024年5月に10になったのが最後)するため、使いにくい部分は ある。