Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ALBの新機能 Automatic Target Weightsとgray failuresに...

da-hatakeyama
December 19, 2023

ALBの新機能 Automatic Target Weightsとgray failuresについて考えてみる

NW-JAWS #11 re:Cap 2023 〜えっ、今年NWのアプデなんてありましたっけ?〜
に登壇した時の資料です

https://jawsug-nw.connpass.com/event/304821/

da-hatakeyama

December 19, 2023
Tweet

More Decks by da-hatakeyama

Other Decks in Technology

Transcript

  1. 自己紹介 名前: 畠山 大治 業務: AWSを使ったインフラ構築 @アイレット株式会社 趣味: Perfumeを追いかける(ファンクラブ 9年目)

    読書、映画・アニメを見る 資格: AWS認定全冠、GC認定ACE 好きなAWSサービス: VPC @hatake_book
  2. ALBの新機能 Automatic Target Weightsについて ⚫公式ブログより引用(元は英文) Application Load Balancer (ALB) の背後にあるターゲットの灰色の障害

    を検出して軽減する機能を提供します 灰色の障害は、ALB ターゲットがアクティブなロード バランサーの ヘルス チェックに合格し、正常に見えてもエラーが返される場合に 発生します
  3. ALBの新機能 Automatic Target Weightsについて ⚫簡単にまとめると… ⚫ ALBのヘルスチェックでは気づけない異常を検知する ⚫ 異常があったターゲットへのトラフィックを調整することも可 ⚫ヘルスチェックでは気づけない異常の例

    ⚫アプリケーション上のバグ ⚫依存関係に起因する障害 ⚫たまにパケットが損失する ⚫ターゲットの過負荷 など これらの異常検知、暫定対応が ALBだけで対応可能に!
  4. gray failuresの例:その1 Route53ヘルスチェック: 異常なし AZ間の通信に障害が 発生しても… AutoScalingグループ: 異常なし Aurora:異常なし フェイルオーバーなし

    よくあるWebサーバー+NLBの構成で考えると… 図引用:https://catalog.workshops.aws/multi-az-gray-failures/en-US/workshop-overview
  5. gray failuresの例:その1 Route53ヘルスチェック: 異常なし AZ間の通信に障害が 発生しても… AutoScalingグループ: 異常なし システム的に異常はないようにみえるが、 実は裏でAZ間の通信障害が発生している!!

    Aurora:異常なし フェイルオーバーなし よくあるWebサーバー+NLBの構成で考えると… 図引用:https://catalog.workshops.aws/multi-az-gray-failures/en-US/workshop-overview
  6. 例その2 ALB+ASGの構成で考えてみる ⚫対応方針 ⚫障害が発生したAZ向きの トラフィックを調整 ⚫対応策 ⚫ATWでトラフィックの重み付け を変更する データプレーンアクション コントロールプレーンアクション

    ⚫対応方針 ⚫障害が発生したAZでリソースの構 成を変更する ⚫対象のAZを設定から除外してリ ソース追加を防ぐ、など ⚫対応策 ⚫AutoScalingグループの設定を 変更する
  7. 参考情報 ⚫Automatic Target Weights リリースのお知らせ ⚫ https://aws.amazon.com/jp/about-aws/whats-new/2023/11/application-load-balancer-availability- target-weights/ ⚫ATWについての紹介ブログ ⚫

    https://aws.amazon.com/jp/blogs/networking-and-content-delivery/improving-availability-with- application-load-balancer-automatic-target-weights/ ⚫ホワイトペーパー:gray failures ⚫ https://docs.aws.amazon.com/ja_jp/whitepapers/latest/advanced-multi-az-resilience-patterns/gray- failures.html