Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ACRiルームにAMD GPUを入れた話
Search
Jun Ando
July 13, 2024
Technology
920
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ACRiルームにAMD GPUを入れた話
fpgax #14
Jun Ando
July 13, 2024
More Decks by Jun Ando
See All by Jun Ando
Ryzen NPUにおけるAI Engineプログラミング
anjn
0
560
ACRiルーム最新情報とAMD GPUサーバーのご紹介
anjn
0
390
AI Engine に適したCNN アーキテクチャの検討と実装
anjn
0
85
Other Decks in Technology
See All in Technology
気軽に使える"情報のハブ"としてのNotion活用 〜フロー情報の集積点 と、 Claude Code × Notion AI〜
syucream
1
200
Agile and AI Redmine Japan 2026
hiranabe
4
490
クレデンシャル流出 ― 攻撃 3 時間 vs 復旧 10 時間。この非対称性にどう備えるか
kazzpapa3
3
570
2026 AI Memory Architecture
nagatsu
0
370
千葉での単身赴任からAWSをやり続け、千葉に戻ってきた話
yama3133
1
120
AI-DLCを “そのまま導入しなかった”話 ~組織に合わせてアジャストした 私たちの実践共有~
hiroramos4
PRO
1
430
元銀行員がAIだけでアプリを量産!「バイブコーディング実演セミナー 」
tatsuya1970
0
110
脱SaaS!FDEを支えるプロビジョニングと分離設計
knih
0
300
[AWS Summit Japan 2026]迷っているあなたへ_小さな一歩が、やがて自分を助けてくれる
sh_fk2
2
420
AI時代に求められる技術力 フロンティア・クリエイティビティ / Technical Excellence in the AI Era: Frontier Creativity
kaonavi
0
110
AIチャット検索改善の3週間
kworkdev
PRO
2
180
自分が詳しくない領域でAIを使う #プロヒス2026
konifar
20
7.5k
Featured
See All Featured
Leo the Paperboy
mayatellez
7
1.9k
Paper Plane (Part 1)
katiecoart
PRO
0
9.2k
Music & Morning Musume
bryan
47
7.2k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
200
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
140
GraphQLとの向き合い方2022年版
quramy
50
15k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
Art, The Web, and Tiny UX
lynnandtonic
304
22k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
72
40k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Transcript
ACRiルームにAMD GPUを入れた話 ACRiルーム副室長/AMD 安藤 ©︎ 2024 Adaptive Computing Research Initiative
- ACRi 1 fpgax #14 LT
fpgax #14 ACRi ルーム ©︎ 2024 Adaptive Computing Research Initiative
- ACRi 2 Alveo / VCK5000 Professors ACRi Founders • Digilent社 Arty A7-35T カード • 1サーバにArtyを15枚接続 • ユーザ毎にVMを割り当て ルーム FPGA Server • CPU: Core i9 (8 core /16 thread) • メモリ: DDR4 128GB (32GB x 4) • ストレージ: SSD M.2 1TB x2 • 開発環境インストール済み Arty A7-35T • 3時間単位で機材を無償で貸出し • リモートからアクセスして利用するスタイル • Forumを通じて大学教員やACRi企業が技術支援を実施 • Xilinxアクセラレータカード • Alveo U50 / U200 / U250 / U280 / VCK5000 Alveo Arty ACRi 参加企業 一般企業 学生 若手技術者 Start-up企業 技術力向上 テスト利用 技術力向上 のため 技術力向上 テスト利用 Instinct • AMD Instinct GPU • MI210 64GB
fpgax #14 AMD Instinct MI210 • スペック概要 ©︎ 2024 Adaptive
Computing Research Initiative - ACRi 3 大容量のVRAMを積んでいるので 生成AIで遊ぶのに良さそう! ACRiルームでMI210が使えるようになる までの話をします
fpgax #14 インストールの準備(冷却) • MI210はファン無しなので冷却ファンを作る • ACRiルームにラックサーバーはありません ©︎ 2024 Adaptive
Computing Research Initiative - ACRi 4 1. ファンを取り付けるアダプタを印刷 2. ちょうど良いねじ穴にねじ止め 3. ファンを装着
fpgax #14 インストールの準備(電源) • MI210の補助電源はATX12V( EPS12V ) • PCIe補助電源を無理に挿すと壊れます •
マザーボード向けを1本 MI210に ©︎ 2024 Adaptive Computing Research Initiative - ACRi 5 マザーボード 電源ユニット ATX12V ATX12V MI210 PCIe補助電源コネクタに見えるが 微妙にピンの形が違う
fpgax #14 インストールの準備が完了 ©︎ 2024 Adaptive Computing Research Initiative -
ACRi 6 自宅での検証の様子。PCケースが小さくて入らなかった
fpgax #14 ACRiルームの仕組み(Alveo系サーバーの場合) ©︎ 2024 Adaptive Computing Research Initiative -
ACRi 7 aservX(物理ホスト) CPU:16 threads Mem:128GB as00X(コンテナ) CPU:8 threads Mem:64GB ファイル サーバー ファイル サーバー /dev/xclmgmt* /dev/dri/renderD* /dev/xfpga/* /dev/xvc_* /scratch /opt/xilinx/platforms /home/$USER /tools NFS NFS Local SSD ssh xrdp 認証 予約 サーバー ログイン サーバー 認証 サーバー Alveo start_container.sh cron 毎分実行 起動/停止/削除 参照 マウント NIS ユーザー
fpgax #14 利用環境内でDockerが使える仕組み • 従来の利用環境はDockerで構築 • Docker内でDockerを動かせるようにするには特権モードが必要 • Rootless Docker
in LXD • LXDはシステムコンテナ • コンテナ内でsystemdが動き、仮想マシンのように使える • Ansibleでコンテナ内にデスクトップ環境を構築 • Rootless Dockerはユーザー権限で実行するDocker • ユーザーが自由にコンテナを使用できる ©︎ 2024 Adaptive Computing Research Initiative - ACRi 8 ホスト LXD Rootless Docker Vitis AI等 PCIeデバイス 利用環境
fpgax #14 利用環境内でDockerが使える仕組み • LXDのidmap設定で一般ユーザーのUID/GIDを一致 • ホストにマウントされたNFSに利用環境からアクセスできる • Rootless Dockerコンテナ内の一般ユーザーには未使用のUID/GIDを割り当てる
©︎ 2024 Adaptive Computing Research Initiative - ACRi 9 ホスト LXD Rootless Docker Vitis AI等 利用環境 root root ??? user-a user-a user-b user-b root UID idmap user-c ??? ??? /etc/subuid /etc/subgid ??? ??? group-d GID
fpgax #14 コンテナ内でAMD GPUを利用する • ROCm • 一般ユーザーが使うにはvideo/renderグループに属している必要あり • ホストのGIDをRootless
Dockerコンテナまでつなげる ©︎ 2024 Adaptive Computing Research Initiative - ACRi 10 ホスト LXD Rootless Docker Vitis AI等 利用環境 root root ??? user-a user-a user-b user-b root UID idmap user-c ??? ??? /etc/subuid /etc/subgid ??? ??? group-d video video video render render render GID idmap
fpgax #14 生成AIを動かしてみる • ROCm Blogs • 週1以上のペースでAIを中心としたGPU活用の記事を配信 • vLLMを動かす記事を試してみた
• Rootless Dockerを使ってvLLMのDockerイメージの作成、動作に成功 ©︎ 2024 Adaptive Computing Research Initiative - ACRi 11 https://rocm.blogs.amd.com/artificial-intelligence/openllm/README.html
fpgax #14 生成AIを動かしてみる • CyberAgentLM3-22B-Chat • 7/9プレスリリース • 22Bパラメータ(45GB) •
MI210なら量子化なしでOK • vLLMで16リクエストを同時処理 • 計約160 tokens/sec ©︎ 2024 Adaptive Computing Research Initiative - ACRi 12 FPGAのエクストリームな使い方を聞いてみています
fpgax #14 チュートリアル作りました • AIモデルをMI210で学習、VCK5000で推論 • https://gw.acri.c.titech.ac.jp/wp/manual/vitis-ai-rocm ©︎ 2024 Adaptive
Computing Research Initiative - ACRi 13 PyTorch Lightningで学習 Vitis AIコンテナで量子化、コンパイル AI Engineで推論
fpgax #14 まとめ • ACRiルームにMI210が入りました • それなりに大きなモデルも動きます • 遊んでみてください ©︎
2024 Adaptive Computing Research Initiative - ACRi 14
fpgax #14 ©︎ 2024 Adaptive Computing Research Initiative - ACRi
15
fpgax #14 ACRi 参加団体(2024年6月) ©︎ 2024 Adaptive Computing Research Initiative
- ACRi 16