Upgrade to Pro — share decks privately, control downloads, hide ads and more …

pre:Invent から気になった サービスを深掘りしてみる - ECS 予測スケーリング編...

Masanori Yamaguchi
February 11, 2025
66

pre:Invent から気になった サービスを深掘りしてみる - ECS 予測スケーリング編 / ECS-predictive-scaling

Masanori Yamaguchi

February 11, 2025
Tweet

More Decks by Masanori Yamaguchi

Transcript

  1. 山口 正徳 フォージビジョン株式会社 執行役員 AWS技術責任者 兼 AWS事業責任者 グローバル認定/表彰 ・AWS Community

    HERO ・AWS Ambassador ・APJ AWS Community Leaders Award 2回受賞(2022、2024) ・AWS Gold Jacket Club 日本国内認定 ・AWS Samurai ・Japan AWS Top Engineer 2019 – 2023(2024は辞退) ・APN ALL AWS Certifications Engineers 2023 – 2024
  2. © 2024 ForgeVision, Inc. 9 ・ メモリ利用率、CPU使用率、ロードバランサーからのリクエスト数などをもとにした静的な オートスケーリング閾値を設定する必要がない。 ・ システムの需要状況を学習することで動的かつプロアクティブなスケーリングを行う。

    ・ 予測スケーリングに任せない明確なスケーリングを閾値を既存スケーリングで設定可能。 ・ パターン化された負荷変動には予測スケーリング、断続的な負荷変動に既存スケーリングなどの使い分け。 ・ 予測のみを行いスケーリングは行わない 「予測のみ」 モードで予測精度と適合性を評価。 ・ 予測はするが実際のスケーリング動作は行わない。(AWS WAF のカウントモードのようなイメージ) 機械学習を利用し、需要予測に先行したオートスケーリングを行う 「予測のみ」モードを利用して事前に予測精度と適合性を確認できる 予測スケーリングと既存スケーリングを併用できる(基本的に併用が前提 ※後述) 予測スケーリングとは コンテナによって1つの処理単位を小さくし、処理状況に応じたスケーリングをより適切に実行することで システム全体の弾力性を向上できる。プロダクションでの利用をおすすめしたい pre:Invent アップデートです。
  3. © 2024 ForgeVision, Inc. 10 ECS予測スケーリング導入時の注意点 ・ 予測スケーリングだけではスケールインされないため、既存スケーリングとの併用が必要。 (基本的に併用が必要として記載していたのはこの為) ・

    予測スケーリングを行うには最低24時間の稼働履歴データが必要。公式では2週間のデータが必要と されている。スケーリングが求められる環境で稼働開始してから2週間は予測のみモードで傾向を確認する。 ・ECSサービス詳細から「サービスの自動スケーリング」タブを選択し、スケーリングポリシーを作成する。 (詳細は次のスライド) 予測スケーリングはスケールアウトのみ、スケールインは行わない 「サービスの更新」からは予測スケーリングは設定できない 作成したばかりのECSサービスでは予測スケーリングは利用できない
  4. © 2024 ForgeVision, Inc. 14 ECSサービス 予測スケーリングを活用するためのポイント ・ 予測のみモードでスケーリング ポリシーを構成して事前にスケーリング頻度など確認する。

    ・ マネージメントコンソールから予測結果に基づく推奨事項も確認できる。 ・ 業務アプリケーションや開発環境など利用される時間がパターン化している環境。 EventBridgeを用いてスケジュール型のスケーリングは可能だが、タスク数などの調整も予測スケーリングに 任せることができる。 ・ メッセージキューイングと連携したイベント駆動型ワークロードにおいて、メッセージ数ではスケーリングを 制御できない場合、予測スケーリングで使ってベースラインを設定する。 ・ 予測スケーリング、既存スケーリングはそれぞれ独立して必要タスク数を計算するため、既存スケーリング ポリシーが現在のタスクよりも少ないタスク数を算出した場合でも、ECSはスケールインを行わない。 予測スケーリング、既存スケーリングの両方が現在のタスクよりも少ないタスク数を算出場合に スケールイン処理を行う。 予測スケーリングが適している環境か事前の確認が必要 予期せぬスケールインへの保険とする 予測スケーリングが適している環境を認識して適用対象を選択する