Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「プログラマーのためのCPU入門」は入り口として丁度よい!
Search
forrep
February 28, 2024
Programming
48
32k
「プログラマーのためのCPU入門」は入り口として丁度よい!
forrep
February 28, 2024
Tweet
Share
More Decks by forrep
See All by forrep
Linux && Docker 研修/Linux && Docker training
forrep
27
5.2k
RAGにベクトルDBは必要ない!DBも不要で運用めちゃ楽な RAG Chatbot を作った話
forrep
37
16k
Google Analytics でサイト速度を計測する / Measure site speed with Google Analytics
forrep
2
320
最近コードレビューで指摘したこと
forrep
3
500
DevTools でパフォーマンスチューニング入門 / Introduction to Performance Tuning with DevTools
forrep
2
420
技術的負債に対する視力を得る / How to View Technical Debt
forrep
0
780
しくじり先生 - NFS+sqliteで苦労した話から学ぶ、問題解決の考え方 / problem-solving approach
forrep
1
1.2k
理屈で考える、データベースのチューニング / Database tuning How-To
forrep
28
9.2k
ブラウザの制約条件から考えるフロントエンドのリソース設計/Frontend Performance How to
forrep
2
810
Other Decks in Programming
See All in Programming
202507_ADKで始めるエージェント開発の基本 〜デモを通じて紹介〜(奥田りさ)The Basics of Agent Development with ADK — A Demo-Focused Introduction
risatube
PRO
6
1.3k
DMMを支える決済基盤の技術的負債にどう立ち向かうか / Addressing Technical Debt in Payment Infrastructure
yoshiyoshifujii
5
690
JetBrainsのAI機能の紹介 #jjug
yusuke
0
160
顧客の画像データをテラバイト単位で配信する 画像サーバを WebP にした際に起こった課題と その対応策 ~継続的な取り組みを添えて~
takutakahashi
4
1.4k
商品比較サービス「マイベスト」における パーソナライズレコメンドの第一歩
ucchiii43
0
240
AIのメモリー
watany
12
1.1k
Vibe Codingの幻想を超えて-生成AIを現場で使えるようにするまでの泥臭い話.ai
fumiyakume
21
9.8k
新世界の理解
koriym
0
100
Strands Agents で実現する名刺解析アーキテクチャ
omiya0555
1
110
NEWT Backend Evolution
xpromx
1
170
Terraform やるなら公式スタイルガイドを読もう 〜重要項目 10選〜
hiyanger
9
2.4k
ZeroETLで始めるDynamoDBとS3の連携
afooooil
0
140
Featured
See All Featured
Practical Orchestrator
shlominoach
190
11k
Designing for Performance
lara
610
69k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
8
720
Art, The Web, and Tiny UX
lynnandtonic
301
21k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
48
2.9k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Testing 201, or: Great Expectations
jmmastey
44
7.6k
Become a Pro
speakerdeck
PRO
29
5.5k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Gamification - CAS2011
davidbonilla
81
5.4k
Transcript
「プログラマーのためのCPU入門」 は入り口として丁度よい! ~ Webエンジニア目線 ~ 1 株式会社ラクーンホールディングス 技術戦略部 羽山純
自己紹介 • 名前 ◦ 羽山 純(Jun Hayama) • 所属 ◦
株式会社ラクーンホールディングス 技術戦略部 • 技術領域 ◦ バックエンド・インフラ ◦ パフォーマンス改善 ▪ MySQLでプライマリキーをUUIDにする前に知っておいて欲しいこと ◦ AI(企業審査AI) • 個人活動 ◦ アプリ開発 2
紹介する書籍 プログラマーのためのCPU入門 - CPUは如何にしてソフトウェアを 高速に実行するか いわゆる「低レイヤ」の書籍です 3 Takenobu Tani.(2023-1-25).“プログラマーのためのCPU入門 -
CPUは如何にしてソフトウェアを高速に実行するか”.ラムダ ノート.https://www.lambdanote.com/products/cpu
「低レイヤ」について、こう思っていませんか? • WebエンジニアにはCPUほどの低レイヤは必要ない • クラウド環境だから細かいことを考えなくてもよい • 現代のCPUは十分に速いから気にしなくてもよい → そんなことはありません 4
本書で得られるメリット(1) 本書で得られるメリット(1) カーネルの理解を深められる 5
カーネルの知識を深められる 上位レイヤは下位レイヤに依存し、 各レイヤの習得には1~2レイヤ下までの知識が必要です 本書はCPUへの理解を通して カーネルの理解を深めてくれます 6 アプリケーション ライブラリ・FW ランタイム・VM コンパイラ
ユーザー空間 カーネル ハードウェア OS CPU 他 言語 依存 依存 依存 依存 依存
本書で得られるメリット(2) 本書で得られるメリット(2) 長く生きる汎用的な知識と問題解決力 7
山で遭難したら登れ 「山で遭難したら登れ」と言われます 逆すり鉢の形状で山頂に近づくほど狭くなるため 登ると正規ルートに復帰できる可能性が 高くなります この形は先ほどの「低レイヤ」の図 と似てませんか? 8
低レイヤほどバリエーションが減少 アプリケーションは要件やサービスだけ星の数ほど ライブラリ・FW は Django, Flask, SpringBoot, Rails, , ,
その下層は Python, Java, Ruby, , , OS は Linux がデファクト 低レイヤほどバリエーションが少なく 長く使える汎用的な知識となります 9 アプリケーション ライブラリ・FW ランタイム・VM コンパイラ ユーザー空間 カーネル ハードウェア OS CPU 他 言語
問題解決力 問題解決では、順に低レイヤに降りると解決しやすいです いずこかで発生した問題に対し、 降りられる限界のレイヤが そのエンジニアの力量です 本書でCPUの知識を通して カーネルへの理解を深めると 問題解決力が上昇します 10 アプリケーション
ライブラリ・FW ランタイム・VM コンパイラ ユーザー空間 カーネル ハードウェア OS CPU 他 言語
本書で得られるメリット(3) 本書で得られるメリット(3) パフォーマンスはやっぱり大切 11
アプリ・インフラの高速化のヒントがたくさん • システムコールが遅い理由を仕組みから理解できた • メモリは仮想記憶のため1度の取得に2回のアクセスが必要 ◦ 仮想アドレスと物理アドレスをページテーブルで変換 ◦ ページテーブルのキャッシュ(TLB)をミスするととても遅い ◦
巨大なメモリ空間を利用するとページテーブルが肥大化する • メモリはCPUより4倍ほど遅いが、L1キャッシュミスすると 100倍ほどまで遅くなる、メインメモリはとても遅い ◦ 小さいメモリ空間の利用は速いが、巨大なメモリ空間をランダ ムで使うと、キャッシュミスして100~1000倍は遅い • 複数コア・マルチスレッドで同一アドレスへの書き込みを行 うと「コヒーレンスミス」が発生して非常に遅い ◦ マルチプロセスモデルの方が優れているシーンもある 12
まとめと余談 Webエンジニア目線で本書は CPUを通してカーネルの知識を深めるために有用です そして、効率的なアルゴリズムを組むのに最適な知識が たくさん詰まっています パズルの最適解を探すアプリを開発していた時代に 出会っていたら、あと2割は演算を速くできたと思います 13