Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AVXって何だ?
Search
kkojima
September 15, 2020
Technology
1
860
AVXって何だ?
GPUなしでもここまでできるAI構築シリーズ2020.9.17
https://ibm-developer.connpass.com/event/187302/
kkojima
September 15, 2020
Tweet
Share
More Decks by kkojima
See All by kkojima
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 4」カスタムAIモデルの作成からモデルのデプロイまで
kkojima
0
250
最終回、オープンソースの話します
kkojima
1
230
AIデータはどうためる、テープアーカイブの復権
kkojima
0
180
AIに必要なデータをどう送るか、ネットワークを考える
kkojima
0
330
x86 CPUで動くAIアプリ作成で知っていると便利な基礎知識
kkojima
0
820
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 3」事前準備
kkojima
0
280
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 2」インテルがチューンしたPythonとTensorFlow
kkojima
0
1.5k
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 2」環境構築手順
kkojima
0
390
Other Decks in Technology
See All in Technology
エラーとアクセシビリティ
schktjm
1
1.2k
なぜテストマネージャの視点が 必要なのか? 〜 一歩先へ進むために 〜
moritamasami
0
220
品質視点から考える組織デザイン/Organizational Design from Quality
mii3king
0
200
データアナリストからアナリティクスエンジニアになった話
hiyokko_data
2
440
「どこから読む?」コードとカルチャーに最速で馴染むための実践ガイド
zozotech
PRO
0
300
AI開発ツールCreateがAnythingになったよ
tendasato
0
130
JTCにおける内製×スクラム開発への挑戦〜内製化率95%達成の舞台裏/JTC's challenge of in-house development with Scrum
aeonpeople
0
210
AIのグローバルトレンド2025 #scrummikawa / global ai trend
kyonmm
PRO
1
280
La gouvernance territoriale des données grâce à la plateforme Terreze
bluehats
0
170
DevIO2025_継続的なサービス開発のための技術的意思決定のポイント / how-to-tech-decision-makaing-devio2025
nologyance
1
390
Generative AI Japan 第一回生成AI実践研究会「AI駆動開発の現在地──ブレイクスルーの鍵を握るのはデータ領域」
shisyu_gaku
0
160
ガチな登山用デバイスからこんにちは
halka
1
240
Featured
See All Featured
Optimizing for Happiness
mojombo
379
70k
Navigating Team Friction
lara
189
15k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Music & Morning Musume
bryan
46
6.8k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
61k
Six Lessons from altMBA
skipperchong
28
4k
The World Runs on Bad Software
bkeepers
PRO
70
11k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Designing for humans not robots
tammielis
253
25k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.5k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
810
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
840
Transcript
GPUなしでもここまでできるAI構築シリーズ 2020.9.17 「AVXってなんだ?」
「GPUなしでもここまでできるAI構築」 今回のシリーズでの範囲は: 出荷数が圧倒的に多いインテル x86 CPU を対象とします (Macユーザ、⼤歓迎) IBM Cloud でも利⽤できる
AVX-512 搭載機種がベスト でも AVX2 でもそれなりに実感できるはず
全4回あります (初回は座学のみ 第2,3,4回はハンズオンあり) 1回 9⽉17⽇ 14:00 座学 2回 10⽉29⽇ 14:00
座学, ハンズオン 3回 11⽉12⽇ 14:00 座学, ハンズオン 4回 12⽉10⽇ 14:00 座学, ハンズオン 「GPUなしでもここまでできるAI構築」
わたしたちの環境
計算⽅法によって機械には向き不向きがある JAMSTEC 地球シュミレータ ベクトル演算専⽤機 (おそらく現⾏では唯⼀) シミュレーションモデルが使うメモリが⼤きなベクトル演算に特化
AVX ってなんだ? ベクトル演算ってなんだ? CPUはハードウェアだけど、必ずソフトウェアが命令を出している AIやシミュレーションで重要な命令にSIMDがある SIMDを使った演算をベクトル演算という SIMD: Single Instruction Multiple
Data AVX: Advanced Vector Extensions
AVX ってなんだ? AIと関係あるの? シミュレーションではモデル(本物の特徴を掴んだ枠)をつくる ⽔や空気、物体などは3次元以上の要素でモデルを計算する必要がある GPU: 重要な要素だけ選択的に計算して表⽰することが得意(ゲーム映像など) CPU: 緻密に再現することが得意 (AVXはこの密度を⾼める)
Deep Learningではシミュレーションと同じベクトル演算が使われる
AVX ってなんだ? どれくらい強⼒なの? コンピュータの能⼒の尺度に FLOPS (⼀秒に何回浮動⼩数点 演算ができるか)があります AVXなし 1 FLOPS/クロック
AVXあり 8 FLOPS/クロック AVX2あり 16 FLOPS/クロック もし性能が⼗分にひきだせるソフトを利⽤するならばAVXなし に⽐較するとAVX2は16倍の性能がクロックあたり出せるかも
AVX ってなんだ? インテルだけ? AVXはAMDのCPUにも⼊っている AVX2, AVX-512と進化している (こちらはインテルが先⾏)
AVX ってなんだ? CPUが対応していればOK? AVXはハードウェアの機能 (CPUに埋め込まれている) でもほんとうに⼤事なのは開発環境(ソフトウェア) このシリーズではここを深掘りします
AI 専⽤機だとどうなっているの? おすすめ資料: CQ出版社 ⽉刊インターフェース 10⽉号 ほとんどの製品、コンセプトが網羅されている (DLU はあったけど SX-Aurora
がなかったのは残念) 過渡期の今、われわれがどこにいるかわかる
本⽇の⽬⽟ この事実にあなたはおどろく。。 「インテル製 TensorFlow があるなんて」
次回以降の環境 Mac sysctl machdep.cpu.brand_string Windows 10 (PowerShell) @((Get-WmiObject Win32_Processor).Name)[0] Linux
lscpu | grep "Model name” (仮想環境だとうまく表⽰されないので lscpu 出⼒の Flags:を確認) 1. Google、Qwant など検索エンジンで出⼒を調べる (Intel製だったら) Intel Ark というCPUスペック表がみつかるはず 2. AVX2, AVX-512 が記載されていれば当たりです もし表⽰がなくてもこのシリーズの⼿順は素振り練習としてできます お⼿元の環境を次回までにご確認ください
例: Macが該当しているか調べる kojima@mac ~ % sysctl machdep.cpu.brand_string machdep.cpu.brand_string: Intel(R) Core(TM)
i5-4278U CPU @ 2.60GHz i5-4278U を Web 検索 さらに ark.intel.comの該当ページで “AVX” を検索 すると “Instruction Set Extensions Intel® SSE4.1, Intel® SSE4.2, Intel® AVX2” AVX2 当たり!
まずは楽しんでください !