③ 別AZに移動したPrometheus Server Podが起動しない! どんな課題だった? 3. EKS運用で直面した問題とその解決策 ◼ マネージドスクレイパーに移行する前に発生した問題 ◼ ワーカーノードのメンテでPrometheus Server Podを退避させたところ、別AZのワーカーノードにスケジューリングされた ◼ Prometheus Server PodはEBSボリュームをマウントする仕様 ◼ EBSボリュームはAZリソースなのでAZを跨いでマウントする事ができない ◼ 別AZ上のPrometeheus Server PodはPVをマウントできずに起動に失敗した Az-a EKS ワーカーノード メンテ対象 Prometheus Server Pod EBSボリューム マウント Az-c EKS ワーカーノード Prometheus Server Pod 起動失敗 EBSボリュームはAZリソースなのでAZを跨いでマウントできない Drainコマンドで退避 マウント
③ 別AZに移動したPrometheus Server Podが起動しない! どうやって解決した? 3. EKS運用で直面した問題とその解決策 ◼ この問題が発生しない様にワーカーノードのメンテ手順を修正した ◼ 事前に同じAZにワーカーノードを起動させ、そこにPrometheus Sever Podを退避させる様にした ◼ マネージドスクレイパーを導入する事でPrometheus Server Podが無くなったため、現在はこの運用は不要になっています ◼ EBSボリュームをマウントするPodを運用する際には注意が必要 Az-a EKS ワーカーノード メンテ対象 Prometheus Server Pod EBSボリューム マウント EKS ワーカーノード Prometheus Server Pod Drainコマンドで退避 マウント Az-c EKS ワーカーノード NEW