Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CloudWatch Container Insightsを使ったAmazon ECSのリソース監視
Search
umehara
January 29, 2025
Technology
450
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
CloudWatch Container Insightsを使ったAmazon ECSのリソース監視
umehara
January 29, 2025
More Decks by umehara
See All by umehara
Infrastructure as Codeのはじめ方 ~NRIネットコム TECH AND DESIGN STUDY #93~
umekou
1
140
Amazon S3 Vectorsを使って低コストRAGを組んでみる
umekou
0
160
AWSサービスアップデート202507.pdf
umekou
0
100
AWSマンスリーアップデートピックアップ!! 2025年4月分
umekou
0
110
コンソールで学ぶ!AWS CodePipelineの機能とオプション
umekou
3
340
AWS Well-Architected Frameworkで学ぶAmazon ECSのセキュリティ対策
umekou
2
310
AWSサービスアップデート 2025/02
umekou
0
110
AWSサービスアップデート202412 re:Invent特別編
umekou
0
140
DDoS攻撃への対策できてますか?
umekou
0
40
Other Decks in Technology
See All in Technology
アジャイルな経理と Claude Code と経営の未来
kawaguti
PRO
3
150
日本 Fintech 未来予測レポート 2027〜2028年(手動編集版)
8maki
0
2.4k
就職⽀援サービスにおけるキャリアアドバイザーのシフトスケジューリング
recruitengineers
PRO
1
150
Claude Codeとのおしゃべりでセマンティックモデルの定義からダッシュボード作成まで完成させる
nic_sugiyama
0
120
AIはどのように 組織のアジリティを変えるのか?
junki
4
970
脆弱性対応、どこで線を引くか
rymiyamoto
1
400
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
360
非エンジニアがClaudeと挑んだ「1ヶ月間プロダクト30本ノック」
askokc
0
610
Bucharest Tech Week 2026 - Reinventing testing practices in the AI era
edeandrea
PRO
1
160
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
140
2026 TECHFRESH 畢業分享會 - AI-Native 重塑軟體工程與虛擬講師
line_developers_tw
PRO
0
1.2k
LayerXにおけるセキュリティ管理の現在地と次の一手
tosho
0
220
Featured
See All Featured
Balancing Empowerment & Direction
lara
6
1.2k
Bash Introduction
62gerente
615
220k
Design in an AI World
tapps
1
240
Evolving SEO for Evolving Search Engines
ryanjones
0
220
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
270
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
330
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
200
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
54k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
How STYLIGHT went responsive
nonsquared
100
6.2k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
360
Java REST API Framework Comparison - PWX 2021
mraible
34
9.4k
Transcript
CloudWatch Container Insightsを使った Amazon ECSのリソース監視 NRIネットコム×NHN テコラス共催ウェビナー 2025年1月29日 NRIネットコム株式会社 Webインテグレーション事業部
基盤デザイン課 梅原 航
1 Copyright(C) NRI Netcom, Ltd. All rights reserved. 基本情報
梅原 航(うめはら こう) NRIネットコム株式会社 Webインテグレーション事業部(@大阪) AWSを使ったシステムのインフラ開発・運用に従事 好きなAWSサービス 所有資格 自己紹介 Amazon Elastic Container Service (Amazon ECS) #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
2 Copyright(C) NRI Netcom, Ltd. All rights reserved. アプリケーション開発ではコンテナを使うことがデファクトスタンダード
コンテナの利点 ポータビリティが優れており、ローカル環境からプロダクション環境へのデプロイが容易 より軽量な仮想化技術であり、デプロイが高速であるため、スケーラビリティが優れている インフラをコードで管理するため、再現性が高い なぜコンテナを採用するか #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 3層Webアプリケーション
3 Copyright(C) NRI Netcom, Ltd. All rights reserved. インフラの状態を外部から把握できるようにしておく
システムのリソース情報が適切に管理できていないと? 詳細な情報を取得できない 複数コンポーネントにまたがる場合、処理を追うことが困難 サービスに異常があることに気付くことができない オブザーバビリティの重要性 このタスクの CPU使用率って・・・? レスポンス遅延 内部APIへは どんなリクエストがきてる? #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
4 Copyright(C) NRI Netcom, Ltd. All rights reserved. メトリクス
特定期間のシステムの状態データを集計してグラフ化したもの ログ システムで発生した処理の詳細を示したテキスト トレース 異なるコンポーネント間にまたがる処理過程の情報 オブザーバビリティの3要素 #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します メトリクス 【例】 CPU使用率 メモリ使用率 ︙ ログ 【例】 アプリケーションログ アクセスログ ︙ トレース 【例】 AWS X-Ray ︙
5 Copyright(C) NRI Netcom, Ltd. All rights reserved. 本日はメトリクスに絞ってお話します(ECS
on Fargate前提) Amazon CloudWatchを使用すると、Amazon ECSでどのようなメトリクスを取得できるのか Container Insightsとはなにか? どのメトリクスを対象に監視を行うべきか お話しないこと AWS Distro for Open Telemetryなどのサイドカーコンテナを前提とした構成 AWS以外のSaasオブザーバビリティツールの話 以降の内容について #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します メトリクス 【例】 CPU使用率 メモリ使用率 ︙ ログ 【例】 アプリケーションログ アクセスログ ︙ トレース 【例】 AWS X-Ray ︙
6 Copyright(C) NRI Netcom, Ltd. All rights reserved. ECSサービス単位しか取得できない
CPUUtilization MemoryUtilization ECSサービス単位なので、複数タスクがあるときはメトリクスが均らされてしまう 特定のタスクだけ負荷が集中すると検知することができない Amazon ECSのデフォルト設定で出力されるメトリクス #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 複数タスクがあるときに均される 例)CPU平均が50%となる
7 Copyright(C) NRI Netcom, Ltd. All rights reserved. コンテナ化されたアプリケーションのメトリクスとログを収集、集計、要約するサービス
メトリクスとログ、トレースを自動で一元的に集約してくれる デフォルトと比較してより詳細なメトリクスを取得できる クラスターの設定から有効化することができる サービスレベルの情報だと不十分であるケースが多いため、 基本的には有効にしておく パフォーマンスログイベントがCloudWatch logsに出力され それを元にメトリクス集計される仕組み CloudWatch Container Insightsとは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します ECSサービスのログ例
8 Copyright(C) NRI Netcom, Ltd. All rights reserved. 実際にAWSコンソールを見てみましょう #nncstudy
転載、複製、改変等、および許諾のない二次利用を禁止します
9 Copyright(C) NRI Netcom, Ltd. All rights reserved. re:Invent2024で発表された新しいアップデート
オブザーバビリティツールとしての進化 クラスター、サービス、タスク、コンテナと メトリクスの単位を変えながら確認可能 タスク、コンテナのメトリクスを取得可能に より詳細なモニタリングが可能に オブザーバビリティが強化されたAmazon ECS Container Insightsとは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します アップデート後 アップデート前 ContainerInstanceCount ContainerInstanceCount ContainerCpuUtilized ContainerCpuReserved ContainerCpuUtilization ContainerMemoryUtilized ContainerMemoryReserved ContainerMemoryUtilization ContainerNetworkRxBytes ContainerNetworkTxBytes ContainerStorageReadBytes ContainerStorageWriteBytes CpuUtilized CpuUtilized CpuReserved CpuReserved DeploymentCount DeploymentCount DesiredTaskCount DesiredTaskCount EBSFilesystemSize EBSFilesystemSize EBSFilesystemUtilized EBSFilesystemUtilized EphemeralStorageReserved EphemeralStorageReserved EphemeralStorageUtilized EphemeralStorageUtilized MemoryUtilized MemoryUtilized MemoryReserved MemoryReserved NetworkRxBytes NetworkRxBytes NetworkTxBytes NetworkTxBytes PendingTaskCount PendingTaskCount RunningTaskCount RunningTaskCount RestartCount RestartCount ServiceCount ServiceCount StorageReadBytes StorageReadBytes StorageWriteBytes StorageWriteBytes TaskCount TaskCount TaskCPUUtilization TaskEphemeralStorageUtilization TaskMemoryUtilization TaskSetCount TaskSetCount 取得可能なメトリクス名 特定のタスクに含まれるコンテナのCPU使用率も検知可能
10 Copyright(C) NRI Netcom, Ltd. All rights reserved. システム特性や監視要件、コストを考慮して決定する必要がある
最低限として以下のような基本的なメトリクスを監視する CPU使用率 メモリ使用率 ストレージ(エフェメラル、EBS) タスク数 ALB(リクエスト数、レスポンスタイム、5XXエラー数) 必ずしも強化されたContainer Insightsが必要とは限らない システムを構成するコンポーネント数が少なく、コンテナレベルでのメトリクスは不要 コンピュートリソースのチューニングのために、性能テスト時のみ一時的に利用する (個人的に)強化されたContainer Insightsのアップデートは、 CloudWatchがオブザーバビリティツールとしての進化を感じることができるアップデートでした 主要な監視対象のメトリクス #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
11 Copyright(C) NRI Netcom, Ltd. All rights reserved. 取得可能なメトリクス一覧
Amazon ECS 用にオブザーバビリティメトリクスが強化された Container Insights https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/Container-Insights-enhanced- observability-metrics-ECS.html 「Amazon ECS Container Insights メトリクス」 https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/Container-Insights-metrics- ECS.html Container Insightsの料金 オブザーバビリティが強化されたContainer Insightsと通常のContainer Insightsでは料金体系が異なります https://aws.amazon.com/jp/cloudwatch/pricing/ 参考情報 #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
None