Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
bootjp / ぶーと
November 03, 2025
Research
710
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp / ぶーと
November 03, 2025
More Decks by bootjp / ぶーと
See All by bootjp / ぶーと
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.8k
AWSの耐久性のあるRedis互換KVSのMemoryDBについての論文を読んでみた
bootjp
1
770
パーソナライズされたコンテンツ配信のための低遅延分散KVSの構築 VRChat ver / Building-a-low-latency-distributed-KVS-for-personalized-content-delivery-VRChat-ver
bootjp
1
130
Raftとは? 仕組みから考える得意なこと苦手なこと/What is Raft? Strengths and Weaknesses Based on Its Mechanism
bootjp
7
3.9k
Spannerはなぜ原子時計が必要だったのか?/あるいはSpanner Cloneはなぜ不要にできたのか? / Why did Spanner need an atomic clock? Or Why could Spanner Clone not be needed?
bootjp
1
150
【VAアカデミア用】パーソナライズされたコンテンツ配信のための低遅延分散KVSの構築
bootjp
0
37
Other Decks in Research
See All in Research
Sequences of Logits Reveal the Low Rank Structure of Language Models
sansantech
PRO
1
270
AY 2026 Guide to Academic Writing Using Generative AI - Workshop
ks91
PRO
0
120
セマンティック通信勉強会 6Gに向けたデバイス間効率的な通信の技術紹介・課題・今後展望
satai
3
170
東京大学工学部計数工学科、計数工学特別講義の説明資料
kikuzo
0
520
機械学習で作った ポケモン対戦bot で 遊ぼう!
fufufukakaka
0
320
Data Visualization Tools in the Age of AI
flekschas
0
160
「なんとなく」の顧客理解から脱却する ──顧客の解像度を武器にするインサイトマネジメント
tajima_kaho
10
7.7k
COFFEE-Japan PROJECT Impact Report(Uminomukou Coffee)
ontheslope
0
210
論文紹介:HalluCitation Matters
wasyro
0
100
さくらインターネット研究所テックトーク2026春、研究開発Gr.25年度成果26年度方針
kikuzo
0
150
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
560
CyberAgent AI Lab研修 / Social Implementation Anti-Patterns in AI Lab
chck
7
4.7k
Featured
See All Featured
Become a Pro
speakerdeck
PRO
31
6k
Why Our Code Smells
bkeepers
PRO
340
58k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.6k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
210
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
How to Talk to Developers About Accessibility
jct
2
250
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
66
55k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.3k
Mind Mapping
helmedeiros
PRO
1
260
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
170
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
950
Transcript
Akamaiのキャッシュ効率を支え るAdaptSizeについての論文を読 んでみた 第19回 分散システム集会 on VRChat @bootjp / ぶーと
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
自己紹介 HN: ぶーと 分散システム集会の運営の一人。 RaftやKVS、TiKVが好きです。 仕事では、マイクロサービス/マルチプロダク トに向けた分散基盤の設計や実装をしていま す。 前の仕事ではRaftベースの分散ストレージを 作っていました。
@bootjp
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュしデータを配信する ◦ キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減される
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュしデータを配信する ▪ 雑な言い方をすれば、httpsで扱える分散キャッシュシステム ◦
キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減されることもある ◦ 動画・ライブ配信や静的データの配信などに用いられる ◦ 最近の傾向としてはWAFがCDNに含まれることが多く、セキュリティ向上の要素もある ◦ CDNを用いることで、Origin(データ配信元)はより小さなリソースで運用できる
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュ しデータを配信する ▪ 雑な言い方をすれば、httpsで扱える分散キャッシュシステム
◦ キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減されることもある ◦ 動画・ライブ配信 や静的データ の配信などに用いられる ◦ 最近の傾向としてはWAFがCDNに含まれることが多く、セキュリティ向上の要素もある ◦ CDNを用いることで、Origin(データ配信元)はより小さなリソースで運用できる
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦ CDN は メモリ→ ディスク → オリジンの多段キャッシュで配信効率を最大化している
▪ 今回はメモリを焦点にあてたキャッシュヒット率の向上のはなし ◦ 限られたメモリでのキャッシュヒット率の最適化には2つの要素がある ▪ admission: オブジェクトをキャッシュに入れるかどうかの判断 ▪ eviction: 新たなオブジェクトを追加する際、どのオブジェクトを追い出すかの判断
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 100か国以上の1500を超えるネットワークに170,000台以上のサーバーがある ◦ 様々なサイズを配信する数千のプロバイダーから構成される ◦ リクエストパターンは時間によって大きく異なる ▪
日中時間帯はWebサイトのりように偏る ▪ 夜間はWebサイトに加え大容量なメディアファイルに偏る
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ すべてのオブジェクトがラウンドロビンで均等にアクセスされる環境があるとする ◦ メモリ容量が1GBの時にサイズが100 KBの小さなオブジェクトが10,000個あるとする ◦ 500MBのファイルが新たにリクエストされてキャッシュにAdmissionされる
▪ => 5000オブジェクトがEvictionしキャッシュヒット率が50%を下回る
AkamaiにおけるCDNの課題 • 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 何をEvictionするかではなく、なにをAdmissionするかが大事 ▪ これがAdaptSize(この論文)の前提となっている知識
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • AdaptSizeではマルコフ連鎖チューニングモデルを用いた ◦ アドミッション確率 p(size)=exp(-size/c)(サイズ依存。小さいほど入りやすい) ◦ 各オブジェクト i を
LRU 上の独立マルコフ連鎖でモデル化 ◦ 上昇率 r_i(リクエスト率)と押下率 μ_c(平均場;c に依存)から P_i(in-cache) を閉形式で導出 ◦ P_i(in-cache) = { (exp(r_i/μ_c) - 1) * exp(-c * s_i) } / { 1 + (exp(r_i/μ_c) - 1) * exp(-c * s_i) } ◦ 容量制約 Σ_i P_i * s_i = K を満たすよう μ_c を解き、OHR(c) を評価 ◦ OHR を最大化する c をグローバル探索(例:Δ=250K req ごとに更新) •
AkamaiにおけるCDNの課題 • AdaptSizeではマルコフ連鎖チューニングモデルを用いた ◦ アドミッション確率 p(size)=exp(-size/c)(サイズ依存。小さいほど入りやすい) ◦ 各オブジェクト i を
LRU 上の独立マルコフ連鎖でモデル化 ◦ 上昇率 r_i(リクエスト率)と押下率 μ_c(平均場;c に依存)から P_i(in-cache) を閉形式で導出 ◦ P_i(in-cache) = { (exp(r_i/μ_c) - 1) * exp(-c * s_i) } / { 1 + (exp(r_i/μ_c) - 1) * exp(-c * s_i) } ◦ 容量制約 Σ_i P_i * s_i = K を満たすよう μ_c を解き、OHR(c) を評価 ◦ OHR を最大化する c をグローバル探索(例:Δ=250K req ごとに更新) • よくわかり ませんでし た。。 続きは議論 で...
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
評価手法 • トレースベースシミュレーション+プロトタイプ実装ベンチ ◦ Varnish・Nginx • Akamaiプロダクショントレース ◦ HK: 4.5億
req / 157.5 TiB / 2,500万 objects ◦ US: 4.4億 req / 152.3 TiB / 5,500万 objects • メモリ1.2 GiB、C++シミュレータで各方式のOHRを比較 • 比較対象: Nginx / Varnish / 研究系8手法 / 将来知識ありの SIZE-OPT
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
評価結果 • オンメモリキャッシュヒット率の上昇 ◦ vs Varnish: +47~91% / vs Nginx:
+30~48% ◦ SIZE-OPT の95~99% をオンラインで達成
評価結果 • オンメモリキャッシュヒット率の上昇 ◦ 他の研究手法と比べても高いキャッシュヒット率の維持
評価結果 • 堅牢性 ◦ キャッシュヒット率を維持 ▪ 事前知識を持つSIZE-OPTと比較 • スパイクリクエスト: 95%
• 敵対的ミックス: 81% ◦ Randomized: 短期間に大量のトラフィックが急増するようなケース ◦ Adversarial: 性質の異なるアクセスを繰り返す(Web⇔動画)
評価結果 • 副作用なし/好影響 ◦ DCバイトヒット率は維持、ディスク利用率 −20% / IOPS −10% ◦
E2Eレイテンシ短縮(中央値 −43%, 高分位でも −30%超)
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
まとめと議論 • CDNでは時間帯によってリクエストパターンが異なる • その中でメモリ上のキャッシュヒット率を向上させる必要がある • 異なるオブジェクトを対象としたキャッシュヒット率ではadmissonが大事 ◦ 限られたメモリに大きなファイルを入れるとそれだけでキャッシュヒット率が落ちるため ◦
十分アクセスされる大きなファイルだけを入れる必要がある • 既存の研究ではevictionに焦点を当てたものが多い • AdaptSizeではadmissiionに焦点を当てた • 事前知識がある SIZE-OPTと数ポイントしか性能劣化しない手法を考案した ◦ これが AdaptSize • Varnish統合ができ、非常に使い勝手が良い
議論 • bootjpはマルコフ連鎖の式がよくわからなかったので、詳しい人がいたらぜひ議論をし たいです。 •