Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS Trainium3 をちょっと身近に感じたい
Search
Yasutaka OHMURA
December 08, 2025
Technology
550
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
AWS Trainium3 をちょっと身近に感じたい
re:Growth 2025 札幌
Yasutaka OHMURA
December 08, 2025
More Decks by Yasutaka OHMURA
See All by Yasutaka OHMURA
Amazon QuickSight 視点で読み解くQuick Suite ― 変更点の整理と新機能デモ
bigmuramura
0
730
Claude Opus4.6 PowerPoint作成サンプル
bigmuramura
1
24k
今、GPUが熱い - それを冷やす技術
bigmuramura
1
620
Amazon VPC Lattice 最新アップデート紹介 - PrivateLink も似たようなアップデートあったけど違いとは
bigmuramura
1
1.7k
AWSで挑むゲノム解析 : 普段使わない技術を知ろう
bigmuramura
0
1k
「S3 Express One ZoneとEFSアーカイブを少しだけ詳しくなろう」re:Growth 2023 in Sapporo
bigmuramura
0
1.2k
VPC間通信ができる新サービスVPC Lattice。ん?似たようなサービス他にもなかったっけ? サービスを一度整理してみましょう
bigmuramura
4
6.6k
Other Decks in Technology
See All in Technology
2026-06-24_人とAIの責務分離に基づく開発プロセスの提案.pdf
takahiromatsui
0
110
AIチャット検索改善の3週間
kworkdev
PRO
2
170
AI 不只幫你寫 Code: 當專案從 300 暴增到 1500, 我們如何撐住 DevOps
appleboy
0
200
新しいUbuntu/GNOMEが使いたいからXからWaylandへ移行頑張ってるの巻 2026-06-20
nobutomurata
0
160
FPC(フレキシブル)基板にZephyr実装してみた。
iotengineer22
0
160
サイバーエージェントにおけるAI推進戦略と変革への取り組み
shotatsuge
0
490
「軸足」は 固定しなくていい - 熱量と強みで描く、しなやかなキャリアの形
kakehashi
PRO
1
250
作る力から、見極める力へ — AI時代に広がるエンジニアの価値と役割
rince
0
320
AWS Security Agent といっしょに脅威モデリングをやってみよう
amarelo_n24
1
200
WebGIS AI Agentの紹介
_shimizu
0
540
ロボティクスの技術 / Robotics Technology
ks91
PRO
0
130
【セミナー資料】Claude Code をセキュアに使うための考え方と設定の勘どころ / Claude Code Webinar 20260616
masahirokawahara
2
460
Featured
See All Featured
Marketing to machines
jonoalderson
1
5.5k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Un-Boring Meetings
codingconduct
0
320
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.8k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
260
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Docker and Python
trallard
47
3.9k
The Limits of Empathy - UXLibs8
cassininazir
1
370
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
72
40k
A Tale of Four Properties
chriscoyier
163
24k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
The Cost Of JavaScript in 2023
addyosmani
55
10k
Transcript
2025/12/8 クラウド事業本部 コンサルティング部 ⼤村 保貴 AWS Trainium3 を ちょっと⾝近に感じたい
⾃⼰紹介 大村 保貴 (Yasutaka Ohmura) クラスメソッド株式会社 クラウド事業本部 コンサルティング部 ソリューションアーキテクト 出身
• 網走市(道東、オホーツク海沿いです) • 今年のふるさと納税に網走のホタテはいかがでしょうか 仕事 • お客様のクラウド活用推進のための伴走支援 • 専門はHPC(スパコン)、ライフサイエンス少々 経歴 • オンプレITインフラの設計構築→ 自社IoTサービスの構築運用 → クラスメソッド 受賞 • Japan AWS Top Engineers (Services) 2021, 2023 - 2025 • Japan AWS All Certifications Engineers 2021 - 2025
画像引⽤: AWS re:Invent 2025 - Keynote with CEO Matt Garman
None
Trainium(Trnインスタンス)を 機械学習や推論で使ったことある⽅ 🙋
Amazon Bedrock、Kiro などの AWSの⽣成AIサービスを使っている⽅ 🙋
GPU が溶けそう
8 Open AI CEO サム‧アルトマン⽒の発⾔より 引⽤: Post 2025/3/28
GPU が溶けている
None
計算処理の多くは⾏列演算 ここの計算を GPU が担っている
なぜ GPU が必要とされているのか
なぜ GPU が必要とされているのか? GPU はもともとゲームや映像の描画処理を⾼速化する⽬的で発展してきました
なぜ GPU が機械学習に効いたのか? なぜ GPU が必要とされているのか? 似たようなこと
CPU
CPUは「何でもできる」 複雑な処理でも⾼速にさばけます
GPU
GPU は「並列計算能⼒が⾼い」 ⽐較的シンプルな処理ができるコアを⼤量に持っています
⾏列演算のような計算処理が中⼼の⽣成 AI のワークロードでは、 シンプルな演算を数万コアで処理する GPU が有利でした。
NVIDIA GB300 NVL72 が GPU インスタンスとして提供開始されました 画像引⽤: AWS re:Invent 2025
- Keynote with CEO Matt Garman
NVIDIA Blackwell Ultra GPU データセンター向けの GPU は AI 向けに最適化 CUDA
Core が 20,480個 Tensor Coreが 640 個 画像引⽤: Inside NVIDIA Blackwell Ultra: The Chip Powering the AI Factory Era
Trainium
AWS の⾃社設計の半導体ラインナップ 画像引⽤: AWS re:Invent 2025 - AWS Trn3 UltraServers:
Power next-generation enterprise AI performance(AIM3335)
AWS の⾃社設計の半導体 機械学習‧⽣成 AI 向けのチップとしては 2 種類
AWS の⾃社設計の半導体 機械学習‧⽣成 AI 向けのチップとしては 2 種類 そう思っていた時期がありました
画像引⽤: AWS re:Invent 2025 - Keynote with CEO Matt Garman
Trainium2 は推論も現在世界最⾼レベルとのこと
画像引⽤: AWS re:Invent 2025 - AWS Trn3 UltraServers: Power next-generation
enterprise AI performance(AIM3335)
AWS Trainium3 8 つのコアで、AI 向けの計算専⽤エンジンを積んでいます
で、いつ使うの?
Bedrock、Claude Code、Web アプリ、モバイルアプリの ⼤部分のトラフィックは、Trainium2 で処理されているとのこと 画像引⽤: AWS re:Invent 2025 -
AWS Trn3 UltraServers: Power next-generation enterprise AI performance(AIM3335)
Trainium のお仕事紹介 Claude Sonnet 4.5 Opus 4.5 Haiku 4.5
Trainium のお仕事紹介 Kiro を使っても!
2024年11⽉に Amazon と Anthropic の戦略的提携 Anthropicの主要クラウドプロバイダーとしてAWSを継続 TrainiumとInferentiaを使⽤したトレーニングと展開を⾏うと発表していました
2025年10⽉、11⽉の発表 Google Cloud、Azure + NVIDIA も同様の取り組みをしています
まとめ
Trainium の進化は、 直接 Trn インスタンスを使わないユーザーにも恩恵があります! 現在、Claude モデルでの推論の⼤半は Trainium が処理しています
画像引⽤: AWS re:Invent 2025 - Keynote with CEO Matt Garman
参考 - https://qiita.com/Sh1ragami/items/08a8e36c9fc26695d6d6 - https://note.com/techbits/n/n841792523fb0 - https://developer.nvidia.com/blog/inside-nvidia-blackwell-ultra-the- chip-powering-the-ai-factory-era/ - https://speakerdeck.com/htokoyo/aws-innovate-aws-inferentia-train
ium?slide=16
None