Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SageMaker Hyperpod 101 #regrowth_sapporo
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
takakuni
December 12, 2024
430
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
SageMaker Hyperpod 101 #regrowth_sapporo
takakuni
December 12, 2024
More Decks by takakuni
See All by takakuni
ECS Express Mode
takakuni
0
36
AWS WAF Anti-DDoS Protection in 5 Minutes!
takakuni
0
610
AWS Backup Air-Gapped Vaults with Multi-Party Approval Explained in 5 Minutes!
takakuni
0
310
5min GuardDuty Extended Threat Detection EKS
takakuni
0
380
OpenAI models overview 202505
takakuni
0
440
[Sample] Validate hyperlink for Amazon Bedrock Data Automation
takakuni
0
300
Classmethod AI Talks #13
takakuni
0
430
About Extended Threat Detection in Amazon GuardDuty
takakuni
0
410
What is Amazon Bedrock knowledge base with an Amazon Kendra GenAI index?
takakuni
0
770
Featured
See All Featured
Joys of Absence: A Defence of Solitary Play
codingconduct
1
400
Making the Leap to Tech Lead
cromwellryan
135
9.9k
Between Models and Reality
mayunak
4
340
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
170
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
The Pragmatic Product Professional
lauravandoore
37
7.3k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
1
1.7k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
220
Design in an AI World
tapps
1
250
Transcript
2024/12/12 re:Growth 2024 札幌 たかくに SageMaker HyperPod 101
⾃⼰紹介 • 部署 ◦ AWS 事業本部コンサルティング部 • 名前(ニックネーム) ◦ たかくに
• ロール ◦ ソリューションアーキテクト • re:Invent どうだった? ◦ 楽しかった!が釣りタイトル踏んでしまう
オーバーしたらごめんなさい❤
re:Invent 2024 どうでしたか?
re:Invent 2024 どうでしたか??
re:Invent 2024 どうでしたか???
SageMaker HyperPod すごかったですね!!!!!!!!
Dr. Swami’s Key Note
Dr. Swami’s Key Note
Dr. Swami’s Key Note
Dr. Swami’s Key Note
Dr. Swami’s Key Note
Dr. Swami’s Key Note
SageMaker HyperPod すごかったですね!!!!!!!!
問題です
re:Invent 2023 の Dr.Swami は 何枚⽬でしたでしょう?
正解:2枚⽬
そうです。 2023年に出てきたサービスです。
• ⼤規模な⾔語モデルの推論や分散並列学習を ⾏うプラットフォーム • Slurm と EKS オーケストレーターをサポート • 回復⼒のあるプラットフォームを提供
SageMaker HyperPod
モデルにわたす データセット、トークン、パラメータ
でかい!!!!!!!!!!!
SageMaker HyperPod
安定した機械学習ワークロードを 提供するように設計されている AWS ParallelCluster と⽐べて
SageMaker HyperPod のここがすごい • クラスターヘルスチェック ◦ 起動中やワーカーノード追加前にヘルスチェック ▪ GPU, Trainium,
EFA ▪ EKS の場合はハードウェアまで確認 • ⾃動ノード復旧/再開 ◦ 障害を検知しノードを交換 ◦ 新規ノードはチェックポイントから⾃動で再開
やっと、アップデート紹介です。
• EKS のみサポート • 起動しているインスタンス/タスクの可視化 ◦ GPU の使⽤率、使⽤時間等 • クラスターポリシーを使い統制可能に
Amazon SageMaker HyperPod task governance
Amazon SageMaker HyperPod task governance
• 利⽤可能なコンピュートサイズ、期間を予約 する機能 • 予約期間は1⽇から182⽇まで1⽇単位で設定 • 安くなるわけではない Amazon SageMaker HyperPod
flexible training plans
Amazon SageMaker HyperPod flexible training plans
None