$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「プログラマーのためのCPU入門」は入り口として丁度よい!
Search
forrep
February 28, 2024
Programming
52
36k
「プログラマーのためのCPU入門」は入り口として丁度よい!
forrep
February 28, 2024
Tweet
Share
More Decks by forrep
See All by forrep
Linux && Docker 研修/Linux && Docker training
forrep
28
5.5k
RAGにベクトルDBは必要ない!DBも不要で運用めちゃ楽な RAG Chatbot を作った話
forrep
38
17k
Google Analytics でサイト速度を計測する / Measure site speed with Google Analytics
forrep
2
360
最近コードレビューで指摘したこと
forrep
4
540
DevTools でパフォーマンスチューニング入門 / Introduction to Performance Tuning with DevTools
forrep
2
460
技術的負債に対する視力を得る / How to View Technical Debt
forrep
0
840
しくじり先生 - NFS+sqliteで苦労した話から学ぶ、問題解決の考え方 / problem-solving approach
forrep
1
1.3k
理屈で考える、データベースのチューニング / Database tuning How-To
forrep
28
9.4k
ブラウザの制約条件から考えるフロントエンドのリソース設計/Frontend Performance How to
forrep
2
850
Other Decks in Programming
See All in Programming
dnx で実行できるコマンド、作ってみました
tomohisa
0
120
複数人でのCLI/Infrastructure as Codeの暮らしを良くする
shmokmt
5
2k
宅宅自以為的浪漫:跟 AI 一起為自己辦的研討會寫一個售票系統
eddie
0
380
手が足りない!兼業データエンジニアに必要だったアーキテクチャと立ち回り
zinkosuke
0
120
JEP 496 と JEP 497 から学ぶ耐量子計算機暗号入門 / Learning Post-Quantum Crypto Basics from JEP 496 & 497
mackey0225
2
530
ID管理機能開発の裏側 高速にSaaS連携を実現したチームのAI活用編
atzzcokek
0
140
TypeScript 5.9 で使えるようになった import defer でパフォーマンス最適化を実現する
bicstone
1
570
UIデザインに役立つ 2025年の最新CSS / The Latest CSS for UI Design 2025
clockmaker
10
4.9k
Querying Design System デザインシステムの意思決定を支える構造検索
ikumatadokoro
1
1.2k
大体よく分かるscala.collection.immutable.HashMap ~ Compressed Hash-Array Mapped Prefix-tree (CHAMP) ~
matsu_chara
1
190
分散DBって何者なんだ... Spannerから学ぶRDBとの違い
iwashi623
0
160
All(?) About Point Sets
hole
0
240
Featured
See All Featured
Docker and Python
trallard
46
3.7k
GitHub's CSS Performance
jonrohan
1032
470k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.3k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Facilitating Awesome Meetings
lara
57
6.6k
What's in a price? How to price your products and services
michaelherold
246
12k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
Faster Mobile Websites
deanohume
310
31k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
The Invisible Side of Design
smashingmag
302
51k
Speed Design
sergeychernyshev
33
1.3k
Transcript
「プログラマーのためのCPU入門」 は入り口として丁度よい! ~ Webエンジニア目線 ~ 1 株式会社ラクーンホールディングス 技術戦略部 羽山純
自己紹介 • 名前 ◦ 羽山 純(Jun Hayama) • 所属 ◦
株式会社ラクーンホールディングス 技術戦略部 • 技術領域 ◦ バックエンド・インフラ ◦ パフォーマンス改善 ▪ MySQLでプライマリキーをUUIDにする前に知っておいて欲しいこと ◦ AI(企業審査AI) • 個人活動 ◦ アプリ開発 2
紹介する書籍 プログラマーのためのCPU入門 - CPUは如何にしてソフトウェアを 高速に実行するか いわゆる「低レイヤ」の書籍です 3 Takenobu Tani.(2023-1-25).“プログラマーのためのCPU入門 -
CPUは如何にしてソフトウェアを高速に実行するか”.ラムダ ノート.https://www.lambdanote.com/products/cpu
「低レイヤ」について、こう思っていませんか? • WebエンジニアにはCPUほどの低レイヤは必要ない • クラウド環境だから細かいことを考えなくてもよい • 現代のCPUは十分に速いから気にしなくてもよい → そんなことはありません 4
本書で得られるメリット(1) 本書で得られるメリット(1) カーネルの理解を深められる 5
カーネルの知識を深められる 上位レイヤは下位レイヤに依存し、 各レイヤの習得には1~2レイヤ下までの知識が必要です 本書はCPUへの理解を通して カーネルの理解を深めてくれます 6 アプリケーション ライブラリ・FW ランタイム・VM コンパイラ
ユーザー空間 カーネル ハードウェア OS CPU 他 言語 依存 依存 依存 依存 依存
本書で得られるメリット(2) 本書で得られるメリット(2) 長く生きる汎用的な知識と問題解決力 7
山で遭難したら登れ 「山で遭難したら登れ」と言われます 逆すり鉢の形状で山頂に近づくほど狭くなるため 登ると正規ルートに復帰できる可能性が 高くなります この形は先ほどの「低レイヤ」の図 と似てませんか? 8
低レイヤほどバリエーションが減少 アプリケーションは要件やサービスだけ星の数ほど ライブラリ・FW は Django, Flask, SpringBoot, Rails, , ,
その下層は Python, Java, Ruby, , , OS は Linux がデファクト 低レイヤほどバリエーションが少なく 長く使える汎用的な知識となります 9 アプリケーション ライブラリ・FW ランタイム・VM コンパイラ ユーザー空間 カーネル ハードウェア OS CPU 他 言語
問題解決力 問題解決では、順に低レイヤに降りると解決しやすいです いずこかで発生した問題に対し、 降りられる限界のレイヤが そのエンジニアの力量です 本書でCPUの知識を通して カーネルへの理解を深めると 問題解決力が上昇します 10 アプリケーション
ライブラリ・FW ランタイム・VM コンパイラ ユーザー空間 カーネル ハードウェア OS CPU 他 言語
本書で得られるメリット(3) 本書で得られるメリット(3) パフォーマンスはやっぱり大切 11
アプリ・インフラの高速化のヒントがたくさん • システムコールが遅い理由を仕組みから理解できた • メモリは仮想記憶のため1度の取得に2回のアクセスが必要 ◦ 仮想アドレスと物理アドレスをページテーブルで変換 ◦ ページテーブルのキャッシュ(TLB)をミスするととても遅い ◦
巨大なメモリ空間を利用するとページテーブルが肥大化する • メモリはCPUより4倍ほど遅いが、L1キャッシュミスすると 100倍ほどまで遅くなる、メインメモリはとても遅い ◦ 小さいメモリ空間の利用は速いが、巨大なメモリ空間をランダ ムで使うと、キャッシュミスして100~1000倍は遅い • 複数コア・マルチスレッドで同一アドレスへの書き込みを行 うと「コヒーレンスミス」が発生して非常に遅い ◦ マルチプロセスモデルの方が優れているシーンもある 12
まとめと余談 Webエンジニア目線で本書は CPUを通してカーネルの知識を深めるために有用です そして、効率的なアルゴリズムを組むのに最適な知識が たくさん詰まっています パズルの最適解を探すアプリを開発していた時代に 出会っていたら、あと2割は演算を速くできたと思います 13