Upgrade to Pro — share decks privately, control downloads, hide ads and more …

そもそも AWS FIS について。なぜ今 FIS のハンズオンなのか?などなど

そもそも AWS FIS について。なぜ今 FIS のハンズオンなのか?などなど

2025年7月19日に開催した「【JAWS-UG 神戸 #7】リブートからほぼ1周年!ハンズオン大会〜障害は忘れた頃にやってくる「AWS FIS」で障害を食らってみよう〜」のハンズオン実施時の初期構築のタイミングで発生する待ち時間のつなぎで喋っていた時のスライドです。

イベント:https://jawsug-kobe.connpass.com/event/359389/
当日実行したハンズオンシナリオ:https://github.com/kazzpapa3/jawsug-kobe/tree/main/aws-fis
#jawsug_kobe #jawsug

Avatar for kazzpapa3

kazzpapa3

July 18, 2025
Tweet

More Decks by kazzpapa3

Other Decks in Technology

Transcript

  1. #jawsug_kobe そもそも AWS FIS について。 なぜ今 FIS のハンズオンなのか?などなど [JAWS-UG 神戸

    #7 / ハンズオンの待ち時間用スライド] JAWS-UG 神戸 @kazzpapa3 / ICHINO Kazuaki 2025-07-19
  2. #jawsug_kobe • 名前:市野 和明(いちの かずあき) • 所属:株式会社サーバーワークス    マネージドサービス部 AWSサポート課 •

    好きな AWS サービス:     AWS CloudTrail, AWS CLI • (テクサポとして) 嫌いな AWS サービス: AWS Billing(請求ロジックが難解すぎる) • 趣味:初音ミクが好き、酒を飲む •   @kazzpapa3 はじめまして 3 @kazzpapa3
  3. #jawsug_kobe Amazon Q Developer for CLI + aws_documentation_mcp_server に聞いてみ ました。

    > amazon fis とはなんですか。特徴とできるこ と、できないことを10個程度の箇条書きにして ください Amazon Fault Injection Service(Amazon FIS) とは @kazzpapa3
  4. #jawsug_kobe Amazon FIS の特徴とできること ※Amazon Q の回答です • カオスエンジニアリング実験の実行 -

    本番環境でアプリケーションの障害耐性をテストし、予期しない問題を発見 • 事前設定されたアクション - EC2、RDS、DynamoDB、EKS、ECS等の 主要AWSサービスに対する障害注入アクションを提供 • 安全な実験環境 - CloudWatchアラームによる停止条件とガードレールで 実験を安全に制御 • リアルタイム監視 - 実験の進行状況をリアルタイムで追跡し、 必要に応じて自動停止 • 複数アカウント対応 - マルチアカウント環境での実験実行が可能 • 柔軟なターゲット選択 - 特定のリソースまたはタグや状態に基づく リソースグループを対象に設定 • 並列・順次実行 - アクションを同時実行または順次実行で組み合わせ可能 • API・CLI・コンソール対応 - 複数のインターフェースから実験を管理 • CloudFormation統合 - インフラストラクチャコードとして実験テンプレートを管理 • 詳細な権限制御 - IAMによる細かい権限設定で安全性を確保 @kazzpapa3
  5. #jawsug_kobe Amazon FIS の特徴とできること ※Amazon Q の回答です • カオスエンジニアリング実験の実行 -

    本番環境でアプリケーションの障害耐性をテストし、予期しない問題を発見 • 事前設定されたアクション - EC2、RDS、DynamoDB、EKS、ECS等の 主要AWSサービスに対する障害注入アクションを提供 • 安全な実験環境 - CloudWatchアラームによる停止条件とガードレールで 実験を安全に制御 • リアルタイム監視 - 実験の進行状況をリアルタイムで追跡し、 必要に応じて自動停止 • 複数アカウント対応 - マルチアカウント環境での実験実行が可能 • 柔軟なターゲット選択 - 特定のリソースまたはタグや状態に基づく リソースグループを対象に設定 • 並列・順次実行 - アクションを同時実行または順次実行で組み合わせ可能 • API・CLI・コンソール対応 - 複数のインターフェースから実験を管理 • CloudFormation統合 - インフラストラクチャコードとして実験テンプレートを管理 • 詳細な権限制御 - IAMによる細かい権限設定で安全性を確保 @kazzpapa3 ん?
  6. #jawsug_kobe Amazon FIS のできないこと・制限事項 ※Amazon Q の回答です • 本番環境での無計画実行 -

    事前の計画とテスト環境での検証なしに本番で実行するのは推奨されない • 全AWSサービス対応 - 限定されたAWSサービスのみサポート (EC2、RDS、DynamoDB等) • クロスリージョン実験 - 実験とターゲットリソースは同一リージョンに制限 • 永続的な障害注入 - 最大12時間の時間制限あり • カスタムアクション作成 - 事前定義されたアクション以外は使用不可 • リアルタイムカスタマイズ - 実験実行中のアクション変更は不可 • 完全な障害シミュレーション - 物理的なハードウェア障害等は再現不可 • コスト予測機能 - 実験による潜在的なコスト影響の事前計算機能なし • 自動復旧機能 - 障害注入後の自動復旧は別途設定が必要 • 詳細なログ分析 - 実験結果の詳細分析は外部ツールとの連携が必要 @kazzpapa3
  7. #jawsug_kobe • 主に関西在住の AWS Community Builders (通称 CBs) に新たに就任された 方々と既存の

    CBs たちで AWS さんの大阪オフィスで集まろう、 と企画していた前日の出来事でした • 事象についてはみなさまご存知の通り プライマリおよびセカンダリ電源の供給が中断されたことが原因となり、 東京リージョンの apne1-az4 で基盤障害が発生しました • CBs たちで集まる会では、 「今朝出勤したら問い合わせ、まあまあありましたw」なんて言っていました いろいろありました 13 @kazzpapa3
  8. #jawsug_kobe • 弊社のリソースで影響を受 けたものは?網羅的に案内 ください • なぜ発生したのか? AWS として再発防止策は どう考えている?

    • 世間では騒がれているよう ですが、弊社のリソースに は影響がありません テクサポとして従事する中でい ただいた問い合わせなど @kazzpapa3
  9. #jawsug_kobe • 弊社のリソースで影響を受 けたものは?網羅的に案内 ください • なぜ発生したのか? AWS として再発防止策は どう考えている?

    • 世間では騒がれているよう ですが、弊社のリソースに は影響がありません テクサポとして従事する中でい ただいた問い合わせなど @kazzpapa3 多く目立ったのは以下 • 同じようなことは今後もありうるのか? • うちの環境で喰らったらどうなる?
  10. #jawsug_kobe • 弊社のリソースで影響を受 けたものは?網羅的に案内 ください • なぜ発生したのか? AWS として再発防止策は どう考えている?

    • 世間では騒がれているよう ですが、弊社のリソースに は影響がありません テクサポとして従事する中でい ただいた問い合わせなど @kazzpapa3 多く目立ったのは以下 • 同じようなことは今後もありうるのか? • うちの環境で喰らったらどうなる? クラウドなんだから、やってみればいいじゃない?
  11. #jawsug_kobe • クラウドだからやってみなはれ、と思うものの 実施することでどのような影響が出るかわからない • なんかあったら責任取れないし、上司に試験やること言いにくいなぁ • そもそもカオスエンジニアリングとは? • AWS

    も本番環境での実施を推奨しているわけではない とはいえ、いきなり障害試験はできないか… 21 @kazzpapa3 無責任にぶっ壊せる環境で試してみればいいか!
  12. #jawsug_kobe • クラウドだからやってみなはれ、と思うものの 実施することでどのような影響が出るかわからない • なんかあったら責任取れないし、上司に試験やること言いにくいなぁ • そもそもカオスエンジニアリングとは? • AWS

    も本番環境での実施を推奨しているわけではない とはいえ、いきなり障害試験はできないか… 22 @kazzpapa3 無責任にぶっ壊せる環境で試してみればいいか! まずはやってみて Amazon FIS というサービスを知ってみよう
  13. #jawsug_kobe • クラウドだからやってみなはれ、と思うものの 実施することでどのような影響が出るかわからない • なんかあったら責任取れないし、上司に試験やること言いにくいなぁ • そもそもカオスエンジニアリングとは? • AWS

    も本番環境での実施を推奨しているわけではない とはいえ、いきなり障害試験はできないか… 23 @kazzpapa3 無責任にぶっ壊せる環境で試してみればいいか! まずはやってみて Amazon FIS というサービスを知ってみよう その上で自社・取引先で使えそうか判断してもらおう