Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BufferbloatとLinux
Search
Yutaro Hayakawa
August 08, 2021
Technology
4
1.2k
BufferbloatとLinux
最近勉強したLinuxのBufferbloat対応の動向まとめ
Yutaro Hayakawa
August 08, 2021
Tweet
Share
More Decks by Yutaro Hayakawa
See All by Yutaro Hayakawa
How is Cilium Tested?
yutarohayakawa
5
340
eBPFのこれまでとこれから
yutarohayakawa
10
5.4k
NetKit Device
yutarohayakawa
5
980
eBPFは何が嬉しいのか?
yutarohayakawa
3
1.9k
Prism: Proxies without the Pain
yutarohayakawa
0
220
ipftrace: A Linux Function Tracer for Network People
yutarohayakawa
4
5.7k
きっと明日から役立つeBPFのしくみ
yutarohayakawa
9
3.8k
eBPFをFreeBSDにポーティングしようとしている話
yutarohayakawa
4
3.1k
eBPF Implementation for FreeBSD
yutarohayakawa
0
350
Other Decks in Technology
See All in Technology
.NET 9 のパフォーマンス改善
nenonaninu
0
990
re:Invent 2024 Innovation Talks(NET201)で語られた大切なこと
shotashiratori
0
310
MLOps の現場から
asei
6
650
20241220_S3 tablesの使い方を検証してみた
handy
4
590
社内イベント管理システムを1週間でAKSからACAに移行した話し
shingo_kawahara
0
190
マイクロサービスにおける容易なトランザクション管理に向けて
scalar
0
130
コンテナセキュリティのためのLandlock入門
nullpo_head
2
320
どちらを使う?GitHub or Azure DevOps Ver. 24H2
kkamegawa
0
820
Amazon VPC Lattice 最新アップデート紹介 - PrivateLink も似たようなアップデートあったけど違いとは
bigmuramura
0
200
PHPerのための計算量入門/Complexity101 for PHPer
hanhan1978
5
150
podman_update_2024-12
orimanabu
1
280
株式会社ログラス − エンジニア向け会社説明資料 / Loglass Comapany Deck for Engineer
loglass2019
3
32k
Featured
See All Featured
A Philosophy of Restraint
colly
203
16k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.3k
Statistics for Hackers
jakevdp
796
220k
4 Signs Your Business is Dying
shpigford
181
21k
Navigating Team Friction
lara
183
15k
It's Worth the Effort
3n
183
28k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
7k
Side Projects
sachag
452
42k
How STYLIGHT went responsive
nonsquared
95
5.2k
RailsConf 2023
tenderlove
29
940
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
191
16k
Transcript
BufferbloatとLinux Yutaro Hayakawa 1
Agenda LinuxカーネルのBufferbloat対策を概観する 1. Bufferbloatとは何か 2. Approach 1: Queuing (BQL, TCQ,
AQM, FQ) 3. Approach 2: BBR Congestion Control 2
Bufferbloatとは? ネットワーク装置がパケットをバッファリングしすぎることで起こる望まぬ遅延 * 現代インターネットには大きなバッファを備えた装置がそこかしこにあり過度にバッファリングをしている なぜバッファリングが必要か? 3 10G 1G 帯域の差を埋める 10G
10G 処理遅延を吸収する Forwarding待ちのキュー 処理待ちのキュー *https://www.bufferbloat.net/projects/
パケットネットワークにおけるスループットと遅延の関係 4 Send er Recei ver 10G 1G 100G 出典:
Bufferbloat: Dark Buffers in the Internet
パケットネットワークにおけるスループットと遅延の関係 5 Send er Recei ver 10G 1G 100G Bottleneck
Link 出典: Bufferbloat: Dark Buffers in the Internet
パケットネットワークにおけるスループットと遅延の関係 6 Send er Recei ver 10G 1G 100G In
flight packets => ネットワークの中に あるパケット => 「放たれた」パケット 出典: Bufferbloat: Dark Buffers in the Internet
パケットネットワークにおけるスループットと遅延の関係 7 Send er Recei ver 10G 1G 100G Bottleneck
Bandwidth でスループットは頭打ち 出典: Bufferbloat: Dark Buffers in the Internet
パケットネットワークにおけるスループットと遅延の関係 8 Send er Recei ver 10G 1G 100G キューイングによる遅延
出典: Bufferbloat: Dark Buffers in the Internet
パケットネットワークにおけるスループットと遅延の関係 9 Send er Recei ver 10G 1G 100G Bufferbloatが起きている状態
出典: Bufferbloat: Dark Buffers in the Internet
パケットネットワークにおけるスループットと遅延の関係 10 Send er Recei ver 10G 1G 100G ちょうどいいライン
出典: Bufferbloat: Dark Buffers in the Internet
TCPとbufferbloat 11 出典: Bufferbloat: Dark Buffers in the Internet 現在主流のTCP輻輳制御はロスベース
パケットロスを検出したら送信レートを下げる 現代インターネットのロスの多くはキュー溢れ (tail drop) ロスを検出した時点ではもうすでに激しい Bufferbloatが起きてしまっている 多分この辺でロスする
Active Queue Management (AQM) 12 ネットワーク装置がバッファの残量にかかわらず能動的にパケットを落とす キューを必要以上に長くしないことで遅延を減らす ロスベースの輻輳制御にパケロスを通じてレートを下げるよう促す パケットを落とさずにECNを使う場合もある 有名なもの
- Random Early Detection (RED) (1993) - Controlled Delay (CoDel) (2017) - Common Application Kept Enhanced (CAKE) (2018)
Delay Based Congestion Control 13 パケットロスではなく遅延で輻輳を検出する輻輳制御アルゴリズム データを送信してからACKが返ってくるまでの時間をRTTとして管理する Bufferbloatによる遅延の増大にちゃんと反応できることが期待できる ロスベースの輻輳制御に追い出されやすいという弱点がある 有名なもの
- Vegas (1994) - Bottleneck Bandwidth and Round trip propagation time (BBR) (2016)
LinuxにおけるBufferbloatへの対応 14 LinuxがBufferbloatの対応をすることには大きな意味がある サーバ、クライアント、ホームルータなどのベースになっているシェアの高い OSなため 輻輳制御のような全体で対応が必要なものの利用をユーザに促す効果 おもな対応 内部キューの制御 - BQL,
TSQ - AQM (fq_codel, CAKE) 輻輳制御 (BBR) トラフィックShaping / Pacing (fq, EDT, ETF)
内部キューの制御 15 Byte Queue Limits (BQL) - ドライバーキューの長さを自動調整す る TCP
Small Queues (TSQ) - TCPのソケットごとに使用できるQdisc キューの量を制限する拡張 fq, fq_codel, CAKE - TC Qdiscレイヤでlocally generated なトラフィックにAQMをする 出典: Queueing in the Linux Network Stack
fq / fq_codel 16 FQ (Fair Queuing / Flow Queueing)
CoDel (Controlled Delay AQM) FQでフローごとにキューを分離した上で CoDelでAQMして遅延を制御 ... 5tuple hash CoDel Manage Schedular Schedule Driver Queue
BBR 17 Bufferbloatを念頭において作られた Delayベースの輻輳制御 RTprop (理想的なRTT) の推定 データを送信してから ACKが帰ってくるまでの RTTを一定時間
計測した最小値 BtlBw (理想的な帯域) の推定 データ送信量と送信時刻を記録、 ACKが返ってきた際にレート を計算する これを一定時間計測して最大値を輻輳ウィンドウの計算に使う 計測したRTpropとBtlBwの積、つまり帯域遅延積をとると理想 的なinflightなデータの量がわかる 出典: Bufferbloat: Dark Buffers in the Internet RTprop BtlBw ここを探す
PacingとEarliest Departure Time 18 ウィンドウは「どれくらい」送るかの指標「どれくら いのペースで」送るかは特に標準で規定されてい ない (How much vs
How fast) Pacing 主にTCのレイヤでBpsでパケットの送信間隔を 調節する Earliest Departure Time TCPがパケットごとに出発時間を明示してそれを 元にTCレイヤでスケジューリング
出典 + 歴史のまとめ 19 Bufferbloat: Dark Buffers in the Internet
(2011) bql: Byte Queue Limits (2011) tcp: TCP Small Queues (2012) fq_codel (2012) tcp: TSO packets automatic sizing (2013) fq packet schedular / SO_MAX_PACING_RATE (2013) Bottleneck Bandwidth and Roundtrip propagation time (2016) TCP internal pacing (2017) Earliest Departure Time (2018) Scheduled packet Transmission: ETF (2018) CAKE (2018) Linuxのキューイングに関する素晴らしいまとめ Queueing in the Linux Network Stack Bufferbloatに関する技術や動向をまとめたサイト https://www.bufferbloat.net/projects/ CoDelのRFC https://datatracker.ietf.org/doc/html/rfc8289 fq_codelのRFC https://datatracker.ietf.org/doc/html/rfc8290 主にTCP周りの活動のまとめ https://legacy.netdevconf.info/1.2/papers/bbr-netdev-1.2.new.ne w.pdf
End of Slide 20