Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
さぁV100、メモリをお食べ・・・
Search
nilpe
May 30, 2026
Programming
140
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
さぁV100、メモリをお食べ・・・
Persistent MemoryをGPUから使う方法
nilpe
May 30, 2026
Other Decks in Programming
See All in Programming
Snowflake Summitでの新機能 CoCo / CoWork / snowflake-summit-2026-overall-what-new-coco
tatsuhiro
1
130
Make SRE Operations Easier with Azure SRE Agent
kkamegawa
0
6k
Semantic Version 単位で戦略を柔軟に変えて、パッケージアップデートを自動化する
daitasu
1
240
「なぜそう決めたのか」を残し続ける仕組み ― Notion AI カスタムエージェント × Slack連携による設計判断の自動記録 - NIKKEI Tech Talk #47
niftycorp
PRO
0
170
Skillsは効率化、Agentsは"自分の拡張"——Builder時代のエージェント編成(CC Night 2026)
wemra
1
130
生成AI時代にこそ効くGo | Why Go Works in the Age of Generative AI
mom0tomo
8
3.2k
キャリア迷子上等 ─ "ない道"は自分で作ればいい
16bitidol
3
2.1k
Technical Debt: Understanding it Rightly, Engaging it Rightly #LaravelLiveJP
shogogg
0
230
ローカルLLMでどこまでコードが書けるか -拡張版 / How much code can be written on a local LLM Extended
kishida
11
4.1k
Spec Driven Development | AI Summit Lisbon
danielsogl
PRO
0
190
dRuby over BLE
makicamel
2
340
Spring Security 実践 ─ GraphQL APIで実務に役立つ 認証・認可 を学ぶ
wagyu
0
230
Featured
See All Featured
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
390
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Technical Leadership for Architectural Decision Making
baasie
3
410
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
840
Reality Check: Gamification 10 Years Later
codingconduct
0
2.2k
So, you think you're a good person
axbom
PRO
2
2.1k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
Thoughts on Productivity
jonyablonski
76
5.2k
The Spectacular Lies of Maps
axbom
PRO
1
810
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
200
From π to Pie charts
rasagy
0
210
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
Transcript
さぁV100、メモリをお食べ・・・ KERNEL/VM探検隊@関西 12回目 NILPE(@NILPE_LV01)
自己紹介 nilpeと申します! バイクとカーネルと黒魔術が好きな 筑波大学 情報理工学位プログラム M1 初発表です ↑インターネットコミュ障のアカウント アイコンは実家の犬です
メモリが足りない! 最近、メモリが売られなくなりつつありますよね その他のパーツも高騰 of 高騰
「古い」GPUを有効活用したい 研究室に転がってるV100(PCIe)で遊びたい でもVRAMが32GB ””””ぽっち””””しかない VRAM外のメモリに退避したい! ↑画像はnvidia公式より
私の言う「メモリ」とは Intel Optane Persistent Memoryのこと(生産終了済み)
つかいかた ・Openして ・mmap()して ・cudaHostRegister()するだけ
おもむろに こういうコードを書く↓ best = 0 for size in 二分探索(2 MiB
... 探索上限): if cudaHostRegister(base, size) が成功: best = size cudaHostUnregister(base) 次はもっと大きい size を試す else: 次はもっと小さい size を試す Pmemの実装量とbest を表示する
実行すると あれぇ・・・? ↑DRAM実装量-4GBしか登録できてない
どうやら CUDAランタイムでホストDRAMの実装量を見ているらしい →LD_PRELOADでごまかす
やりなおす あれぇ・・・? ② ↑システムメモリ実装量分しか登録できてない(4GB増えた)
nVIDIAドライバを書き換える
512GBごとにRegisterする
結果
帯域幅
できた!!! ご清聴ありがとうございました Github→https://github.com/nilpe/pmem-gpu- devdax