Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Datadog Network Monitoring を活用して NAT Gateway 課金...

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for Hayato Kawai Hayato Kawai
May 28, 2025
760

Datadog Network Monitoring を活用して NAT Gateway 課金を 80 % 削減した話

Japan Datadog User Group Meetup#10 での登壇資料です
イベントページ: https://datadog-jp.connpass.com/event/349693/
アーカイブ: https://www.youtube.com/watch?v=35JcoUB8m6M

Avatar for Hayato Kawai

Hayato Kawai

May 28, 2025
Tweet

More Decks by Hayato Kawai

Transcript

  1. © 2025 Wantedly, Inc. Japan Datadog User Group Meetup #10

    Datadog Network Monitoring を 活⽤して NAT Gateway 課⾦を 80 % 削減した話 2025-05-28 - Hayato Kawai (@fohte)
  2. © 2025 Wantedly, Inc. ⾃⼰紹介 名前 Fohte (ふぉーて) 川井 颯人

    (Hayato Kawai) 所属 ウォンテッドリー株式会社 Infra Squad / AI Enabling Squad
  3. © 2025 Wantedly, Inc. 持ち帰ってほしいこと • Network Monitoring がネットワークコスト削減に 活用できる

    ◦ いつもの Datadog と同じようにネットワーク利用量を クエリできて分析もできる ◦ 通信先 (ドメイン等) や通信元 (アプリケーション等) でも分析できて便利
  4. © 2025 Wantedly, Inc. 背景: AWS の NAT Gateway 利⽤量が想定よりも⾼額に

    • 最近 NAT Gateway を導入した • しかし NAT Gateway は安くない
  5. © 2025 Wantedly, Inc. 背景: AWS の NAT Gateway 利⽤量が想定よりも⾼額に

    • 試算して許容できそうな額だと判断したが、 実際に利用してみると試算の 3 倍もかかった 💸 • => コスト削減が喫緊の課題に 🚨
  6. © 2025 Wantedly, Inc. 無料で利⽤できる Gateway VPC Endpoint の導⼊で 50

    % 削減 • 「S3 の通信は多いだろう」というアタリがあり 無料で利用できる Gateway Endpoint を導入 • これだけでもコストを 50 % 削減できた • しかしまだ試算よりも高い
  7. © 2025 Wantedly, Inc. なぜコストがかかっているのか知りたい • AWS の Cost Explorer

    では NAT Gateway の利用量が 見られる • しかしコストがかかっている真の要因はわからない ◦ コストのボトルネック、具体的には「 NAT Gateway を経由する通信が、 どこからどこに向かって発生しているのか」はわからない
  8. © 2025 Wantedly, Inc. VPC Flow Logs の出番? • AWS

    には通信をモニタリングするサービスがある
  9. © 2025 Wantedly, Inc. VPC Flow Logs は今回の⽤途にはあまり活⽤できなかった • 知りたいことは部分的にしか知れなかった

    ◦ 通信先の判別が難しい (IP アドレスしかない。本来はドメインなどで見たい ) ◦ 通信元の判別が難しい (これも IP アドレスしかない) ◦ NAT Gateway を経由しているかわからない (VPC 全体のログのため)
  10. © 2025 Wantedly, Inc. VPC Flow Logs は今回の⽤途にはあまり活⽤できなかった • 分析も大変だった

    ◦ あくまでもログ ◦ サンプリングしてもログ量が膨大で、分析が難しい ◦ ログ保存や分析にも費用がかかる ▪ 分析にお金がかからないのは Datadog の強み 💪
  11. © 2025 Wantedly, Inc. Network Monitoring でボトルネックを発⾒できた なんとかするべき箇所が見えた • データ分析基盤

    (GCS) への送信 (約 40 %) • イベントログの BigQuery への送信 (約 20 %) • Datadog Agent 自体の通信 (約 20 %)
  12. © 2025 Wantedly, Inc. Network Monitoring のここが便利 • 「NAT Gateway

    を経由する通信」でクエリできる ◦ 例: gateway_type:aws_nat_gateway • 送信元や送信先でクエリできる ◦ 例: client_kube_namespac, server_domain • 普段 Datadog を使うように可視化・分析できる ◦ ウォンテッドリーでは Notebook を活用し、ボトルネックの発見や 実際の削減効果のモニタリングをしていた
  13. © 2025 Wantedly, Inc. 成果: コスト最適化に成功 NAT Gateway の利用量を 80

    % 削減できた 🚀 (もともとの想定コストよりもさらに削減できた 👏)
  14. © 2025 Wantedly, Inc. 持ち帰ってほしいこと • Network Monitoring がネットワークコスト削減に 活用できる

    ◦ いつもの Datadog と同じようにネットワーク利用量を クエリできて分析もできる ◦ 通信先 (ドメイン等) や通信元 (アプリケーション等) でも分析できて便利