Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Datadog Network Monitoring を活用して NAT Gateway 課金...

Avatar for Hayato Kawai Hayato Kawai
May 28, 2025
340

Datadog Network Monitoring を活用して NAT Gateway 課金を 80 % 削減した話

Japan Datadog User Group Meetup#10 での登壇資料です
イベントページ: https://datadog-jp.connpass.com/event/349693/
アーカイブ: https://www.youtube.com/watch?v=35JcoUB8m6M

Avatar for Hayato Kawai

Hayato Kawai

May 28, 2025
Tweet

Transcript

  1. © 2025 Wantedly, Inc. Japan Datadog User Group Meetup #10

    Datadog Network Monitoring を 活⽤して NAT Gateway 課⾦を 80 % 削減した話 2025-05-28 - Hayato Kawai (@fohte)
  2. © 2025 Wantedly, Inc. ⾃⼰紹介 名前 Fohte (ふぉーて) 川井 颯人

    (Hayato Kawai) 所属 ウォンテッドリー株式会社 Infra Squad / AI Enabling Squad
  3. © 2025 Wantedly, Inc. 持ち帰ってほしいこと • Network Monitoring がネットワークコスト削減に 活用できる

    ◦ いつもの Datadog と同じようにネットワーク利用量を クエリできて分析もできる ◦ 通信先 (ドメイン等) や通信元 (アプリケーション等) でも分析できて便利
  4. © 2025 Wantedly, Inc. 背景: AWS の NAT Gateway 利⽤量が想定よりも⾼額に

    • 最近 NAT Gateway を導入した • しかし NAT Gateway は安くない
  5. © 2025 Wantedly, Inc. 背景: AWS の NAT Gateway 利⽤量が想定よりも⾼額に

    • 試算して許容できそうな額だと判断したが、 実際に利用してみると試算の 3 倍もかかった 💸 • => コスト削減が喫緊の課題に 🚨
  6. © 2025 Wantedly, Inc. 無料で利⽤できる Gateway VPC Endpoint の導⼊で 50

    % 削減 • 「S3 の通信は多いだろう」というアタリがあり 無料で利用できる Gateway Endpoint を導入 • これだけでもコストを 50 % 削減できた • しかしまだ試算よりも高い
  7. © 2025 Wantedly, Inc. なぜコストがかかっているのか知りたい • AWS の Cost Explorer

    では NAT Gateway の利用量が 見られる • しかしコストがかかっている真の要因はわからない ◦ コストのボトルネック、具体的には「 NAT Gateway を経由する通信が、 どこからどこに向かって発生しているのか」はわからない
  8. © 2025 Wantedly, Inc. VPC Flow Logs の出番? • AWS

    には通信をモニタリングするサービスがある
  9. © 2025 Wantedly, Inc. VPC Flow Logs は今回の⽤途にはあまり活⽤できなかった • 知りたいことは部分的にしか知れなかった

    ◦ 通信先の判別が難しい (IP アドレスしかない。本来はドメインなどで見たい ) ◦ 通信元の判別が難しい (これも IP アドレスしかない) ◦ NAT Gateway を経由しているかわからない (VPC 全体のログのため)
  10. © 2025 Wantedly, Inc. VPC Flow Logs は今回の⽤途にはあまり活⽤できなかった • 分析も大変だった

    ◦ あくまでもログ ◦ サンプリングしてもログ量が膨大で、分析が難しい ◦ ログ保存や分析にも費用がかかる ▪ 分析にお金がかからないのは Datadog の強み 💪
  11. © 2025 Wantedly, Inc. Network Monitoring でボトルネックを発⾒できた なんとかするべき箇所が見えた • データ分析基盤

    (GCS) への送信 (約 40 %) • イベントログの BigQuery への送信 (約 20 %) • Datadog Agent 自体の通信 (約 20 %)
  12. © 2025 Wantedly, Inc. Network Monitoring のここが便利 • 「NAT Gateway

    を経由する通信」でクエリできる ◦ 例: gateway_type:aws_nat_gateway • 送信元や送信先でクエリできる ◦ 例: client_kube_namespac, server_domain • 普段 Datadog を使うように可視化・分析できる ◦ ウォンテッドリーでは Notebook を活用し、ボトルネックの発見や 実際の削減効果のモニタリングをしていた
  13. © 2025 Wantedly, Inc. 成果: コスト最適化に成功 NAT Gateway の利用量を 80

    % 削減できた 🚀 (もともとの想定コストよりもさらに削減できた 👏)
  14. © 2025 Wantedly, Inc. 持ち帰ってほしいこと • Network Monitoring がネットワークコスト削減に 活用できる

    ◦ いつもの Datadog と同じようにネットワーク利用量を クエリできて分析もできる ◦ 通信先 (ドメイン等) や通信元 (アプリケーション等) でも分析できて便利