Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CloudWatch Application Signals と APM の入門

CloudWatch Application Signals と APM の入門

Kento Kimura

August 21, 2024
Tweet

More Decks by Kento Kimura

Other Decks in Technology

Transcript

  1. Self-Introduction • 所属:Technical Solutions / Sales Engineer • 担当:パブリッククラウドのアーキテクト知識を活かした  Datadog

    のプリセールス技術支援 • 資格:Google Cloud 全 11 資格、AWS 10 資格、Azure 12 資格 • 表彰:Google Cloud Partner Top Engineer 2023-24 2022-24 APN All AWS Certifications Engineer 2023 Japan AWS Jr.Champion → AWS Community Builder(2024) 木村 健人 (Kento Kimura) Datadog Japan GK History データセンター運用保守 → パブリッククラウド技術支援 → プリセールス技術支援 Community Jr. Champions Meetup, JAWS, Jagu'e'r, CloudNative Days
  2. Agenda 3 01 APM 入門 02 APM on AWS 03

    CloudWatch Application Signals 04 まとめ
  3. Application Performance Monitoring とは ソフトウェアツールとテレメトリデータを使用して、 ビジネスクリティカルなアプリケーションのパフォーマンスをモニタリングするプロセス ソフトウェアツール: 監視エージェントや Software Development

    Kit(SDK) などのツール AWS では CloudWatch Agent, X-Ray SDK など テレメトリデータ: CPU 使用率・応答時間・エラー率・レイテンシーなどの監視情報 APM では主にアプリケーションの指標である RED メトリクスを重視 6 引用「APM (アプリケーションパフォーマンスモニタリング ) とは何ですか ?」https://aws.amazon.com/jp/what-is/application-performance-monitoring/ “ “
  4. RED メトリクスのいろは • Requests: アプリケーション処理がリクエストされた回数。処理の種類毎に分類する。 • Errors: アプリケーションエラーの発生した回数。エラー率を指標とすることが多い。 • Duration:

    アプリケーションの処理にかかる時間。p50, p75, p90, p95 などを参照する。 RED メトリクスのようなアプリケーションのメトリクスを把握することで、 CPU・メモリ・ディスクの使用率、ネットワークトラフィックなどのメトリクスに比べ より利用者の体験に即した指標をもとに意思決定ができる。 他にも USE メソッドやゴールデンシグナルなどがあるが、今回は割愛… アプリケーション処理の統計メトリクスだけではなく、 処理毎のパフォーマンスを見るには分散トレーシングが重要 7
  5. AWS の APM ~X-Ray のハナシ~ AWS X-Ray • 2017/4 GA(一般公開)

    • CloudWatch と別のエコシステム ◦ SDK でコードに組み込み ◦ Daemon で監視情報の集約 ◦ API で AWS へ連携 ◦ Browser で可視化 • 2019/11 CloudWatch ServiceLens • CloudWatch との連携(メトリクス・ログ) ◦ X-Ray と CloudWatch のテレメトリ(監視データ)が、 AWS Console 上で統合される 11 AWS X-Ray AWS Tools and SDKs AWS CLI X-Ray SDKs AWS Cloud Control API AWS Management Console X-Ray daemon
  6. AWS の APM ~CloudWatch のハナシ~ Amazon CloudWatch • AWS 上のリソースをリアルタイムに監視するソリューション

    • 2019/11 Console 上の X-Ray 統合 • 2021/11 ADOT(AWS Distro for OpenTelemetry) がアプリケーショントレースをサポート • 2023/8 CloudWatch Agent の X-Ray, OpenTelemetry サポート • 2023/11(AWS re:Invent 2023) CloudWatch Application Signals(preview) が発表 • 2024/6 CloudWatch Application Signals が GA CloudWatch のエコシステムを中心に APM のサポートを拡大していきそう 12
  7. CloudWatch のサービス群 13 CloudWatch ダッシュボード CloudWatch メトリクス CloudWatch アラーム CloudWatch

    ネットワークモニタリング CloudWatch インフラストラクチャーインサイト CloudWatch APM CloudWatch Application Signals CloudWatch サービスレベル目標 CloudWatch Synthetics CloudWatch RUM CloudWatch ログ CloudWatch イベント CloudWatch Evidently
  8. CloudWatch の APM ≒ Application Signals Amazon CloudWatch Application Signals(GA)

    CloudWatch Agent のデプロイできる、EKS, ECS, EC2 において、 X-Ray, ADOT の自動計装エージェントがアプリケーションを監視するソリューション ※APM は言語毎に実装が異なり、GA 直後の現在は Java, Python の対応 • X-Ray 独自の利点(SQS, SNS, EventBridge etc のトレース)を保ちながら、OSS である OpenTelemetry の恩恵を受けれらる • OpenTelemetry のエコシステムの拡大に合わせて、Application Signals も対応言語や 収集できるテレメトリを拡大できる • Management Console 上では Application Signals の専用ビューが用意されており、 サービスやトポロジーを監視するための情報を可視化できる 15
  9. Appendix: 手動計装と自動計装 手動計装(Manual instrumentation) アプリケーションコードに 手動でSDK/ライブラリ を組み込み、監視テレメトリデータを生成する 処理をコードに実装して、トレースを行う Goのコードへの実装例: 16

    自動計装(Auto instrumentation) アプリケーションコードに変更を加えずに、 アプリケーション処理を動的にイジェクト(Java, Python)するツールを実装して、トレースを行う Java への実装例:.jar ファイル取得と-javaagent:引数の設定 import ( "os" "github.com/aws/aws-xray-sdk-go/awsplugins/ec2" "github.com/aws/aws-xray-sdk-go/xray" ) func init() { // conditionally load plugin if os.Getenv("ENVIRONMENT") == "production" { ec2.Init() } xray.Configure(xray.Config{ ServiceVersion: "1.2.3", }) } 引用「AWS X-Ray デベロッパーガイド」https://docs.aws.amazon.com/ja_jp/xray/latest/devguide/ $ wget \ https://github.com/aws/aws-xray-java-agent/releases/latest/ download/xray-agent.zip disco ├── disco-java-agent.jar └── disco-plugins ├── aws-xray-agent-plugin.jar ├── disco-java-agent-aws-plugin.jar ├── disco-java-agent-sql-plugin.jar └── disco-java-agent-web-plugin.jar
  10. Application Signals のアーキテクチャ • EC2 の場合は CW エージェントと別に、 ADOT などによるアプリケーションの

    計装が必要 • CW エージェントが Application Signals にトレース情報を書き込むために追加の IAM 権限が必要( application-signals:* ) 17 AWS Cloud Availability Zone 1 Virtual private cloud (VPC) Instance NAT gateway Instance with CloudWatch Endpoints Amazon CloudWatch    EC2 Instance CloudWatch エージェント ログファイル /var/log Java/Python アプリケーション ADOT
  11. まとめ • CloudWatch Application Signals は CloudWatch が OpenTelemetry に対応し、

    それぞれの利点を活かしシステムのオブザーバビリティを実現できるソリューション • ECS, EKS, EC2 で利用できるが、ADOT による自動計装は Java, Python のみ • OpenTelemetry を活用することで、その他のアプリケーションの APM ができる • CloudWatch SLO や CloudWatch Observability EKS アドオンなど本日お話し できていないものも面白そう 19