Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
さぁV100、メモリをお食べ・・・
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
nilpe
May 30, 2026
Programming
100
0
Share
さぁV100、メモリをお食べ・・・
Persistent MemoryをGPUから使う方法
nilpe
May 30, 2026
Other Decks in Programming
See All in Programming
Swiftのレキシカルスコープ管理
kntkymt
0
200
TypeSpec で繋ぐ複数プロダクトの型安全
maroon8021
1
260
iOS26時代の新規アプリ開発
yuukiw00w
0
210
SPMマルチモジュールで テストカバレッジを取得する技法
yosshi4486
0
130
分析エージェント精度向上における データアナリストの役割
oura_shoya
0
130
AI Agent と正しく分析するための環境作り
yoshyum
3
630
Migrations : C'est une question d'hygiène !
vinceamstoutz
0
2.4k
net-httpのHTTP/2対応について
naruse
0
180
タクシーアプリ『GO』の バックエンド開発のおける AI利活用と若者のすべて
pyama86
3
1.8k
ECR拡張スキャンでSBOMを収集して サプライチェーン攻撃の影響調査を 爆速で終わらせてみた
akihisaikeda
2
200
初めてのRubyKaigiはこう見えた
jellyfish700
0
180
Copilot CLI の継戦能力を高める コンテキスト管理
nozomutu
1
1.1k
Featured
See All Featured
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2.1k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
590
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
520
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.8k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
70
39k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
800
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
2k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
190
So, you think you're a good person
axbom
PRO
2
2k
We Have a Design System, Now What?
morganepeng
55
8.1k
Building the Perfect Custom Keyboard
takai
2
780
Transcript
さぁV100、メモリをお食べ・・・ KERNEL/VM探検隊@関西 12回目 NILPE(@NILPE_LV01)
自己紹介 nilpeと申します! バイクとカーネルと黒魔術が好きな 筑波大学 情報理工学位プログラム M1 初発表です ↑インターネットコミュ障のアカウント アイコンは実家の犬です
メモリが足りない! 最近、メモリが売られなくなりつつありますよね その他のパーツも高騰 of 高騰
「古い」GPUを有効活用したい 研究室に転がってるV100(PCIe)で遊びたい でもVRAMが32GB ””””ぽっち””””しかない VRAM外のメモリに退避したい! ↑画像はnvidia公式より
私の言う「メモリ」とは Intel Optane Persistent Memoryのこと(生産終了済み)
つかいかた ・Openして ・mmap()して ・cudaHostRegister()するだけ
おもむろに こういうコードを書く↓ best = 0 for size in 二分探索(2 MiB
... 探索上限): if cudaHostRegister(base, size) が成功: best = size cudaHostUnregister(base) 次はもっと大きい size を試す else: 次はもっと小さい size を試す Pmemの実装量とbest を表示する
実行すると あれぇ・・・? ↑DRAM実装量-4GBしか登録できてない
どうやら CUDAランタイムでホストDRAMの実装量を見ているらしい →LD_PRELOADでごまかす
やりなおす あれぇ・・・? ② ↑システムメモリ実装量分しか登録できてない(4GB増えた)
nVIDIAドライバを書き換える
512GBごとにRegisterする
結果
帯域幅
できた!!! ご清聴ありがとうございました Github→https://github.com/nilpe/pmem-gpu- devdax