Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
Search
Tenstorrent Japan
October 29, 2025
360
0
Share
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
Tenstorrent TechTalk #4, LT1
Tenstorrent Japan
October 29, 2025
More Decks by Tenstorrent Japan
See All by Tenstorrent Japan
TTデバイスで大規模計算
tenstorrent_japan
0
50
TTデバイス間通信を支えるTT-Fablic解説 Part1
tenstorrent_japan
0
180
TT Korea OSS Program Overview
tenstorrent_japan
0
150
RISC-V CPU「TT-Ascalon」
tenstorrent_japan
0
350
TT OSS Developer Program in Japan
tenstorrent_japan
0
590
TT-NN 概要 ~内部実装の概説
tenstorrent_japan
0
210
TTNNモデル実装 実践編 ~PytorchモデルのTTNN移植から最適化まで~
tenstorrent_japan
0
190
お外でBlackhole
tenstorrent_japan
0
320
Go Out with Blackhole
tenstorrent_japan
0
370
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
698
190k
The Cult of Friendly URLs
andyhume
79
6.9k
Side Projects
sachag
455
43k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
310
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
220
Mobile First: as difficult as doing things right
swwweet
225
10k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
Transcript
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話 大原 遼太郎 漆原 聖仁
自己紹介 とり天(本名:大原 遼太郎) X:@NoOne_1024 職業:半導体屋さん 好きなもの:計算機全般、特にGPGPUや AIチップ、アクセラレータが好き。 実は博士(工学)だったりする。 GPGPU 自称世界最高精度最小電力の Bluetooth
時刻同期システム SRAM設計
共同研究者紹介 漆原聖仁(Urushibara Masato) X: @niwatoriv2 職業:高校生(1年次) 好きなもの:計算機(折角なので作りたい ) ひとこと: 高校生ですが何卒よろしくお願いします。
Numpyのビルドシステムを理解しようと頑張ってます。笑 それとBlackhole欲しくなってきました 良い写真がなかったので代理
RISC-V Vector Extention v1.0とは? RISC-Vのベクトル拡張命令のバージョン1.0 Q. SIMDとの違いは A. ベクトルのレジスタサイズが固定ではない。 ベクトル長が可変なのでAVX512⇛AVX2のようなベクトル長が変わる
変更で再コンパイルが不要(バイナリ互換)
Q.なぜRVV1.0をやろうとしていたのか? A. NumPyの超越関数の高速化に取り組んでいたから。 富士通の研究者によって富岳上で NumPyがSVEにより高速化できることが示されていた。 SVEとRVVは同じ可変長ベクトルで 親戚みたいなもの! これで銅鉄研究(似た性質の対象でや る焼き直しの研究)をやろう! 富岳の
富士通A64FX SVEでNumPy の超越関数が最大 24.3倍高速化 できる 山田, 芙夕楓, 川上, 健太郎, 栗原, 康志, 松田, 一仁, 田原, 司睦, 2022: 情報処理学会, 1–6 p. しかし
既存のRVV1.0をサポートしたプロセッサは少ない Milk-V Jupiter • SoC: SpacemiT M1(SpacemiT
[email protected]
) • RAM:
16GB LPDDR4X • SSD: 500GB M.2 NVMe • 👍RVV 1.0準拠(256 bit vector) これ以外だと個人で買えそうな RVV1.0対応プロセッサはあまり 見つからない(K230くらい?)
思ったほど早くならない 富岳の論文に習い初等関数ライブラリ SLEEでのスカラに対する性能向上を計測 A64FXは無調整の SLEEFで6倍の高速化を達成していた。
(全然話は変わるが) なぜか無関係にBlackhole買っていた Q. なぜBlackholeを買っていたのか A. カッコいいからです(箱からしてカッコいい) • ローカルLLMとかやってみたかった。 • 多体問題とか計算して遊びたかった
私のBlackholeマシン 16777216色🌈に光らないだけでもうカッコいいha-toBlackhole Ubuntu 22.04.5 LTS Blackhole : p100a CPU :Core i5-14500
RAM :DDR4 64GB マザボ:PCI Express 5.0 x16☆ 電源 :ATX 3.1☆ ☆は重要な点
ある日X.comを見ていると これ以降私の BlackholeマシンはRVV1.0実験の専用機と化す ⁉
Blackhole内のx280 • SiFive X280CPU • 4コアが4セット • 512-bit VLEN/256-bit DLEN
• RVV 1.0準拠
△RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
◎RVV1.0で遊ぼうと思ったら (気づかないうちに) x280を買っていた話
X280における実験結果と比較 • 平均で2倍以上の性能向上 SpacemiT K1の向上率を平均で1.36倍上回る性能♪ • でも富岳には全然勝てない (´;ω;`)
今後の予定 NumPyへの統合 まだ、開発環境の整備やライブラリの準備しかできてない。 さらなる最適化 富士通の論文ではアンローリングやパイプライニングで高速化できる ことが示されている。それらも取り込む。 Tensix CoreでもNumpy TensixにもCupyみたいにNumPyを生やしたい (でも、そのためにはBLASが...)
ご静聴ありがとうございました
絶対性能比較