Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AVXって何だ?
Search
kkojima
September 15, 2020
Technology
1
720
AVXって何だ?
GPUなしでもここまでできるAI構築シリーズ2020.9.17
https://ibm-developer.connpass.com/event/187302/
kkojima
September 15, 2020
Tweet
Share
More Decks by kkojima
See All by kkojima
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 4」カスタムAIモデルの作成からモデルのデプロイまで
kkojima
0
210
最終回、オープンソースの話します
kkojima
1
210
AIデータはどうためる、テープアーカイブの復権
kkojima
0
150
AIに必要なデータをどう送るか、ネットワークを考える
kkojima
0
300
x86 CPUで動くAIアプリ作成で知っていると便利な基礎知識
kkojima
0
700
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 3」事前準備
kkojima
0
260
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 2」インテルがチューンしたPythonとTensorFlow
kkojima
0
1.4k
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 2」環境構築手順
kkojima
0
360
Other Decks in Technology
See All in Technology
サービスでLLMを採用したばっかりに振り回され続けたこの一年のあれやこれや
segavvy
2
480
ずっと昔に Star をつけたはずの思い出せない GitHub リポジトリを見つけたい!
rokuosan
0
150
KubeCon NA 2024 Recap / Running WebAssembly (Wasm) Workloads Side-by-Side with Container Workloads
z63d
1
250
Amazon VPC Lattice 最新アップデート紹介 - PrivateLink も似たようなアップデートあったけど違いとは
bigmuramura
0
200
PHP ユーザのための OpenTelemetry 入門 / phpcon2024-opentelemetry
shin1x1
1
250
組織に自動テストを書く文化を根付かせる戦略(2024冬版) / Building Automated Test Culture 2024 Winter Edition
twada
PRO
17
4.6k
ブラックフライデーで購入したPixel9で、Gemini Nanoを動かしてみた
marchin1989
1
540
生成AIをより賢く エンジニアのための RAG入門 - Oracle AI Jam Session #20
kutsushitaneko
4
250
10分で学ぶKubernetesコンテナセキュリティ/10min-k8s-container-sec
mochizuki875
3
350
20241214_WACATE2024冬_テスト設計技法をチョット俯瞰してみよう
kzsuzuki
3
520
TSKaigi 2024 の登壇から広がったコミュニティ活動について
tsukuha
0
160
AWS re:Invent 2024で発表された コードを書く開発者向け機能について
maruto
0
190
Featured
See All Featured
For a Future-Friendly Web
brad_frost
175
9.4k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
810
We Have a Design System, Now What?
morganepeng
51
7.3k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.1k
Writing Fast Ruby
sferik
628
61k
Mobile First: as difficult as doing things right
swwweet
222
9k
How to train your dragon (web standard)
notwaldorf
88
5.7k
Building Adaptive Systems
keathley
38
2.3k
Put a Button on it: Removing Barriers to Going Fast.
kastner
59
3.6k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
1.2k
Fashionably flexible responsive web design (full day workshop)
malarkey
405
66k
The Invisible Side of Design
smashingmag
298
50k
Transcript
GPUなしでもここまでできるAI構築シリーズ 2020.9.17 「AVXってなんだ?」
「GPUなしでもここまでできるAI構築」 今回のシリーズでの範囲は: 出荷数が圧倒的に多いインテル x86 CPU を対象とします (Macユーザ、⼤歓迎) IBM Cloud でも利⽤できる
AVX-512 搭載機種がベスト でも AVX2 でもそれなりに実感できるはず
全4回あります (初回は座学のみ 第2,3,4回はハンズオンあり) 1回 9⽉17⽇ 14:00 座学 2回 10⽉29⽇ 14:00
座学, ハンズオン 3回 11⽉12⽇ 14:00 座学, ハンズオン 4回 12⽉10⽇ 14:00 座学, ハンズオン 「GPUなしでもここまでできるAI構築」
わたしたちの環境
計算⽅法によって機械には向き不向きがある JAMSTEC 地球シュミレータ ベクトル演算専⽤機 (おそらく現⾏では唯⼀) シミュレーションモデルが使うメモリが⼤きなベクトル演算に特化
AVX ってなんだ? ベクトル演算ってなんだ? CPUはハードウェアだけど、必ずソフトウェアが命令を出している AIやシミュレーションで重要な命令にSIMDがある SIMDを使った演算をベクトル演算という SIMD: Single Instruction Multiple
Data AVX: Advanced Vector Extensions
AVX ってなんだ? AIと関係あるの? シミュレーションではモデル(本物の特徴を掴んだ枠)をつくる ⽔や空気、物体などは3次元以上の要素でモデルを計算する必要がある GPU: 重要な要素だけ選択的に計算して表⽰することが得意(ゲーム映像など) CPU: 緻密に再現することが得意 (AVXはこの密度を⾼める)
Deep Learningではシミュレーションと同じベクトル演算が使われる
AVX ってなんだ? どれくらい強⼒なの? コンピュータの能⼒の尺度に FLOPS (⼀秒に何回浮動⼩数点 演算ができるか)があります AVXなし 1 FLOPS/クロック
AVXあり 8 FLOPS/クロック AVX2あり 16 FLOPS/クロック もし性能が⼗分にひきだせるソフトを利⽤するならばAVXなし に⽐較するとAVX2は16倍の性能がクロックあたり出せるかも
AVX ってなんだ? インテルだけ? AVXはAMDのCPUにも⼊っている AVX2, AVX-512と進化している (こちらはインテルが先⾏)
AVX ってなんだ? CPUが対応していればOK? AVXはハードウェアの機能 (CPUに埋め込まれている) でもほんとうに⼤事なのは開発環境(ソフトウェア) このシリーズではここを深掘りします
AI 専⽤機だとどうなっているの? おすすめ資料: CQ出版社 ⽉刊インターフェース 10⽉号 ほとんどの製品、コンセプトが網羅されている (DLU はあったけど SX-Aurora
がなかったのは残念) 過渡期の今、われわれがどこにいるかわかる
本⽇の⽬⽟ この事実にあなたはおどろく。。 「インテル製 TensorFlow があるなんて」
次回以降の環境 Mac sysctl machdep.cpu.brand_string Windows 10 (PowerShell) @((Get-WmiObject Win32_Processor).Name)[0] Linux
lscpu | grep "Model name” (仮想環境だとうまく表⽰されないので lscpu 出⼒の Flags:を確認) 1. Google、Qwant など検索エンジンで出⼒を調べる (Intel製だったら) Intel Ark というCPUスペック表がみつかるはず 2. AVX2, AVX-512 が記載されていれば当たりです もし表⽰がなくてもこのシリーズの⼿順は素振り練習としてできます お⼿元の環境を次回までにご確認ください
例: Macが該当しているか調べる kojima@mac ~ % sysctl machdep.cpu.brand_string machdep.cpu.brand_string: Intel(R) Core(TM)
i5-4278U CPU @ 2.60GHz i5-4278U を Web 検索 さらに ark.intel.comの該当ページで “AVX” を検索 すると “Instruction Set Extensions Intel® SSE4.1, Intel® SSE4.2, Intel® AVX2” AVX2 当たり!
まずは楽しんでください !