$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
今、GPUが熱い - それを冷やす技術
Search
Yasutaka OHMURA
September 26, 2025
1
310
今、GPUが熱い - それを冷やす技術
Yasutaka OHMURA
September 26, 2025
Tweet
Share
More Decks by Yasutaka OHMURA
See All by Yasutaka OHMURA
Amazon VPC Lattice 最新アップデート紹介 - PrivateLink も似たようなアップデートあったけど違いとは
bigmuramura
1
1k
AWSで挑むゲノム解析 : 普段使わない技術を知ろう
bigmuramura
0
830
「S3 Express One ZoneとEFSアーカイブを少しだけ詳しくなろう」re:Growth 2023 in Sapporo
bigmuramura
0
1.1k
VPC間通信ができる新サービスVPC Lattice。ん?似たようなサービス他にもなかったっけ? サービスを一度整理してみましょう
bigmuramura
4
6.1k
Featured
See All Featured
Building Applications with DynamoDB
mza
96
6.8k
Optimising Largest Contentful Paint
csswizardry
37
3.5k
How GitHub (no longer) Works
holman
316
140k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.8k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
How STYLIGHT went responsive
nonsquared
100
5.9k
Designing Experiences People Love
moore
142
24k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Making the Leap to Tech Lead
cromwellryan
135
9.6k
Done Done
chrislema
186
16k
4 Signs Your Business is Dying
shpigford
186
22k
Transcript
今、GPUが熱い それを冷やす技術 ⼤村 保貴 クラスメソッド株式会社 クラウド事業本部 コンサルティング部
⾃⼰紹介 2 大村 保貴 (Yasutaka Ohmura) クラスメソッド株式会社 クラウド事業本部 コンサルティング部 ソリューションアーキテクト
出身 • 網走市 役割 • お客様のクラウド活用推進のための伴走支援 • 専門はHPC(スパコン)、ライフサイエンス少々 経歴 • オンプレITインフラの設計構築→ 自社IoTサービスの構築運用 → クラスメソッド 受賞 • Japan AWS Top Engineers (Services) 2021, 2023 - 2025 • Japan AWS All Certifications Engineers 2021 - 2025
今、GPUが熱い
4 ⽣成 AI への⺠間投資は爆発的に増加しています。 引⽤: The 2025 AI Index Report
⽣成 AI ブーム 2024年の⽣成 AI への⺠間投資額は 339 億ドル 2022年⽐で 8.5 倍以上に増加 ChatGPT 以降、企業の AI 投資が加速
NVIDIA の株価も熱い 5 GPU需要を背景に、NVIDIA社の市場価値も上昇しています 引⽤: Google Finance GPU 需要の爆発で株価も⾼騰 時価総額は
4 兆ドルを突破 AI の進化をハードウェアが⽀えている
GPU の温度が熱い! 6 ⾼性能化する GPU の発熱を冷やすための技術 AWS 最新の液体冷却システムを中⼼に紹介します 空冷の限界を迎える...
最近の GPU サーバー事情
NVIDIA GB200 NVL72 8 最新のNVIDIA GB200 NVL72は、1ラック全体で1つの巨⼤なGPUとして動作します 引⽤: AI Factory
for the New Industrial Revolution | NVIDIA GTC24
NVIDIA GB200 NVL72 9 2 ラックに分けて 1 つの GPU を構成パターンも提供されています
引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering Frontier AI at Scale
NVIDIA GB200 NVL72 10 消費電⼒が⾼すぎて⼀般的なデータセンターに 1 ラック構成で置けない 参考: NVIDIA GB200
スーパーチップと液冷サーバーおよびキャビネットの紹介 GPU 1チップ 約 1.2kW(1200W) 標準的な CPU サーバー消費電力 約 12kW/ラック 多くのデータセンターの標準的なラック 最大 60kW/ラック まで対応 GB200 NVL72 の消費電力 約 120kW/ラック 一部データセンターの対応しているラック 135kW 〜
ドライヤー100台 11 1ラックの消費電⼒は、家庭⽤ドライヤー100台を同時に使うのと同じくらい • ドライヤーの消費電⼒:約1.2kW (1200W) • GPU 1チップ ≒
ドライヤー 1台 • GB200 NVL72 1ラック ≒ ドライヤー 100台 × 100
空冷の限界 12 仮に空気でGPUを冷やすなら、、、 参考: NVIDIA Blackwell プラットフォームが水の使用効率を 300 倍以上改善 データセンターの温度を氷点下まで下げるか、
強⾵レベルの⾵速で熱を逃がし続ける 従来の「空気」で冷やすのは⾮現実的になりました
液体冷却
なぜ「液体」? 14 空気の約1000倍の密度を持つ液体は、熱を奪う効率が圧倒的に良い 密度 運べる熱量 空気 低い 小さい 液体 高い
大きい 参考: NVIDIA Blackwell プラットフォームが水の使用効率を 300 倍以上改善
液体冷却の⽅式 15 L2L(Liquid to Liquid) DLC(Direct Liquid Cooling) L2A(Liquid to
Air)
液体冷却システムの導⼊課題(L2A) 16 床下に冷却⽔の配管を張り巡らせる必要があり、導⼊に時間がかかる 引⽤: AI Factory for the New Industrial
Revolution | NVIDIA GTC24
AWSの場合 17 市場の既製品では、AWSが求める「スピード」と「スケール」を実現できませんでした 参考: AWS’s New Liquid Cooling Solution Rattled
the Market—But Is It Truly Disruptive? • リードタイム: 新規データセンター建設には数年かかる • 拡張性: 既製品はAWSの巨⼤なスケール要求に合わない • 効率⾯: 既製品ではDCのフロアスペースを取りすぎる • 改修コスト: 既存データセンターの⼤幅な改修が必要
液体冷却システムを作った 18 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering Frontier
AI at Scale IRHX(In-Row Heat Exchanger)の登場
設計思想 19 ラックのためにデータセンターを設計する必要がない 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
IRHX 20 3つのコンポーネントに分かれています 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale ⽔配分ユニット ポンプ ファンコイル
IRHX 21 サーバラック横の⽔配分キャビネットからサーバーラックへ直接配管 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
IRHX 22 ポンプから送り出された冷却液で熱源(GPUのチップ)を直接冷却 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
IRHX 23 熱を奪った冷却液はラック隣の⽔配分キャビネットへ戻り 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
IRHX 24 ポンプ横のファンで熱くなった冷却液を冷やし、最終的に熱は既存の空調システムで処理 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
拡張性が⾼い 25 将来GPUがもっと熱くなっても、ファンを追加するだけで対応できる 引⽤: Introducing Amazon EC2 P6e-GB200 UltraServers: Powering
Frontier AI at Scale
最近の製品(Delta's Air-Assisted Liquid Cooling) 26 引⽤: 革新的冷却システム | Air-Assisted Liquid
Cooling with Side Car Heat Exchanger ラックの隣に液冷ユニットを配置する構成
まとめ 27 • ⽣成AIブームでGPU需要が爆発 • 最新のGPUは液冷必須 • AWSは既存のDCを活かした設計で液体冷却システム(IRHX)を開発し解決した
None