Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AVXって何だ?
Search
kkojima
September 15, 2020
Technology
1
800
AVXって何だ?
GPUなしでもここまでできるAI構築シリーズ2020.9.17
https://ibm-developer.connpass.com/event/187302/
kkojima
September 15, 2020
Tweet
Share
More Decks by kkojima
See All by kkojima
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 4」カスタムAIモデルの作成からモデルのデプロイまで
kkojima
0
230
最終回、オープンソースの話します
kkojima
1
220
AIデータはどうためる、テープアーカイブの復権
kkojima
0
160
AIに必要なデータをどう送るか、ネットワークを考える
kkojima
0
310
x86 CPUで動くAIアプリ作成で知っていると便利な基礎知識
kkojima
0
760
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 3」事前準備
kkojima
0
270
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 2」インテルがチューンしたPythonとTensorFlow
kkojima
0
1.4k
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 2」環境構築手順
kkojima
0
370
Other Decks in Technology
See All in Technology
バクラクの認証基盤の成長と現在地 / bakuraku-authn-platform
convto
1
610
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
0
110
フロントエンドも盛り上げたい!フロントエンドCBとAmplifyの軌跡
mkdev10
2
280
YOLOv10~v12
tenten0727
4
960
アジャイル脅威モデリング#1(脅威モデリングナイト#8)
masakane55
3
230
Cursor AgentによるパーソナルAIアシスタント育成入門―業務のプロンプト化・MCPの活用
os1ma
14
4.8k
日経電子版 for Android の技術的課題と取り組み(令和最新版)/android-20250423
nikkei_engineer_recruiting
0
410
LiteXとオレオレCPUで作る自作SoC奮闘記
msyksphinz
0
690
ブラウザのレガシー・独自機能を愛でる-Firefoxの脆弱性4選- / Browser Crash Club #1
masatokinugawa
1
490
MCPを活用した検索システムの作り方/How to implement search systems with MCP #catalks
quiver
12
6.8k
ここはMCPの夜明けまえ
nwiizo
28
9.8k
クォータ監視、AWS Organizations環境でも楽勝です✌️
iwamot
PRO
1
320
Featured
See All Featured
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Six Lessons from altMBA
skipperchong
27
3.7k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
How STYLIGHT went responsive
nonsquared
99
5.5k
Designing for humans not robots
tammielis
252
25k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
178
53k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
The Power of CSS Pseudo Elements
geoffreycrofte
75
5.8k
Done Done
chrislema
183
16k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Optimizing for Happiness
mojombo
377
70k
4 Signs Your Business is Dying
shpigford
183
22k
Transcript
GPUなしでもここまでできるAI構築シリーズ 2020.9.17 「AVXってなんだ?」
「GPUなしでもここまでできるAI構築」 今回のシリーズでの範囲は: 出荷数が圧倒的に多いインテル x86 CPU を対象とします (Macユーザ、⼤歓迎) IBM Cloud でも利⽤できる
AVX-512 搭載機種がベスト でも AVX2 でもそれなりに実感できるはず
全4回あります (初回は座学のみ 第2,3,4回はハンズオンあり) 1回 9⽉17⽇ 14:00 座学 2回 10⽉29⽇ 14:00
座学, ハンズオン 3回 11⽉12⽇ 14:00 座学, ハンズオン 4回 12⽉10⽇ 14:00 座学, ハンズオン 「GPUなしでもここまでできるAI構築」
わたしたちの環境
計算⽅法によって機械には向き不向きがある JAMSTEC 地球シュミレータ ベクトル演算専⽤機 (おそらく現⾏では唯⼀) シミュレーションモデルが使うメモリが⼤きなベクトル演算に特化
AVX ってなんだ? ベクトル演算ってなんだ? CPUはハードウェアだけど、必ずソフトウェアが命令を出している AIやシミュレーションで重要な命令にSIMDがある SIMDを使った演算をベクトル演算という SIMD: Single Instruction Multiple
Data AVX: Advanced Vector Extensions
AVX ってなんだ? AIと関係あるの? シミュレーションではモデル(本物の特徴を掴んだ枠)をつくる ⽔や空気、物体などは3次元以上の要素でモデルを計算する必要がある GPU: 重要な要素だけ選択的に計算して表⽰することが得意(ゲーム映像など) CPU: 緻密に再現することが得意 (AVXはこの密度を⾼める)
Deep Learningではシミュレーションと同じベクトル演算が使われる
AVX ってなんだ? どれくらい強⼒なの? コンピュータの能⼒の尺度に FLOPS (⼀秒に何回浮動⼩数点 演算ができるか)があります AVXなし 1 FLOPS/クロック
AVXあり 8 FLOPS/クロック AVX2あり 16 FLOPS/クロック もし性能が⼗分にひきだせるソフトを利⽤するならばAVXなし に⽐較するとAVX2は16倍の性能がクロックあたり出せるかも
AVX ってなんだ? インテルだけ? AVXはAMDのCPUにも⼊っている AVX2, AVX-512と進化している (こちらはインテルが先⾏)
AVX ってなんだ? CPUが対応していればOK? AVXはハードウェアの機能 (CPUに埋め込まれている) でもほんとうに⼤事なのは開発環境(ソフトウェア) このシリーズではここを深掘りします
AI 専⽤機だとどうなっているの? おすすめ資料: CQ出版社 ⽉刊インターフェース 10⽉号 ほとんどの製品、コンセプトが網羅されている (DLU はあったけど SX-Aurora
がなかったのは残念) 過渡期の今、われわれがどこにいるかわかる
本⽇の⽬⽟ この事実にあなたはおどろく。。 「インテル製 TensorFlow があるなんて」
次回以降の環境 Mac sysctl machdep.cpu.brand_string Windows 10 (PowerShell) @((Get-WmiObject Win32_Processor).Name)[0] Linux
lscpu | grep "Model name” (仮想環境だとうまく表⽰されないので lscpu 出⼒の Flags:を確認) 1. Google、Qwant など検索エンジンで出⼒を調べる (Intel製だったら) Intel Ark というCPUスペック表がみつかるはず 2. AVX2, AVX-512 が記載されていれば当たりです もし表⽰がなくてもこのシリーズの⼿順は素振り練習としてできます お⼿元の環境を次回までにご確認ください
例: Macが該当しているか調べる kojima@mac ~ % sysctl machdep.cpu.brand_string machdep.cpu.brand_string: Intel(R) Core(TM)
i5-4278U CPU @ 2.60GHz i5-4278U を Web 検索 さらに ark.intel.comの該当ページで “AVX” を検索 すると “Instruction Set Extensions Intel® SSE4.1, Intel® SSE4.2, Intel® AVX2” AVX2 当たり!
まずは楽しんでください !