Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
bootjp / ぶーと
November 03, 2025
Research
710
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp / ぶーと
November 03, 2025
More Decks by bootjp / ぶーと
See All by bootjp / ぶーと
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.8k
AWSの耐久性のあるRedis互換KVSのMemoryDBについての論文を読んでみた
bootjp
1
770
パーソナライズされたコンテンツ配信のための低遅延分散KVSの構築 VRChat ver / Building-a-low-latency-distributed-KVS-for-personalized-content-delivery-VRChat-ver
bootjp
1
130
Raftとは? 仕組みから考える得意なこと苦手なこと/What is Raft? Strengths and Weaknesses Based on Its Mechanism
bootjp
7
3.9k
Spannerはなぜ原子時計が必要だったのか?/あるいはSpanner Cloneはなぜ不要にできたのか? / Why did Spanner need an atomic clock? Or Why could Spanner Clone not be needed?
bootjp
1
150
【VAアカデミア用】パーソナライズされたコンテンツ配信のための低遅延分散KVSの構築
bootjp
0
37
Other Decks in Research
See All in Research
論文紹介 "ReSim: Reliable World Simulation for Autonomous Driving"
kogo
0
640
明日から使える!研究効率化ツール入門
matsui_528
13
7.4k
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2.2k
Spatial Active Noise Control Based onSound Field Interpolation Incorporating Physical Constraints
skoyamalab
0
110
東京大学工学部計数工学科、計数工学特別講義の説明資料
kikuzo
0
520
「車1割削減、渋滞半減、公共交通2倍」を 熊本から岡山へ@RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
1
1.2k
SAKURAONE:An Open Ethernet-based AI HPC System And Its Observed Workload Dynamicsin a Single-Tenant LLM Development Environment
yuukit
1
380
Ankylosing Spondylitis
ankh2054
0
180
業界横断 副業コンプライアンス調査 三者(副業者・本業先・発注者)におけるトラブル認知ギャップの構造分析
fkske
0
1.3k
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
560
Sequences of Logits Reveal the Low Rank Structure of Language Models
sansantech
PRO
1
270
適応的スパムフィルタのための軽量な類似メッセージカウンタ / jsai2026-adaptive-spam-filter
monochromegane
0
3.9k
Featured
See All Featured
sira's awesome portfolio website redesign presentation
elsirapls
0
280
What's in a price? How to price your products and services
michaelherold
247
13k
Claude Code のすすめ
schroneko
67
230k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
300
Code Review Best Practice
trishagee
74
20k
Deep Space Network (abreviated)
tonyrice
0
210
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
430
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.8k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
870
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
240
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
310
Transcript
Akamaiのキャッシュ効率を支え るAdaptSizeについての論文を読 んでみた 第19回 分散システム集会 on VRChat @bootjp / ぶーと
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
自己紹介 HN: ぶーと 分散システム集会の運営の一人。 RaftやKVS、TiKVが好きです。 仕事では、マイクロサービス/マルチプロダク トに向けた分散基盤の設計や実装をしていま す。 前の仕事ではRaftベースの分散ストレージを 作っていました。
@bootjp
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュしデータを配信する ◦ キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減される
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュしデータを配信する ▪ 雑な言い方をすれば、httpsで扱える分散キャッシュシステム ◦
キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減されることもある ◦ 動画・ライブ配信や静的データの配信などに用いられる ◦ 最近の傾向としてはWAFがCDNに含まれることが多く、セキュリティ向上の要素もある ◦ CDNを用いることで、Origin(データ配信元)はより小さなリソースで運用できる
Akamaiとは • CDN(Contents Delivery Service)の一つ ◦ リクエストをしたユーザーに物理的に近いノードにキャッシュ しデータを配信する ▪ 雑な言い方をすれば、httpsで扱える分散キャッシュシステム
◦ キャッシュをせずとも最適な経路を通ることでレイテンシーが軽減されることもある ◦ 動画・ライブ配信 や静的データ の配信などに用いられる ◦ 最近の傾向としてはWAFがCDNに含まれることが多く、セキュリティ向上の要素もある ◦ CDNを用いることで、Origin(データ配信元)はより小さなリソースで運用できる
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦ CDN は メモリ→ ディスク → オリジンの多段キャッシュで配信効率を最大化している
▪ 今回はメモリを焦点にあてたキャッシュヒット率の向上のはなし ◦ 限られたメモリでのキャッシュヒット率の最適化には2つの要素がある ▪ admission: オブジェクトをキャッシュに入れるかどうかの判断 ▪ eviction: 新たなオブジェクトを追加する際、どのオブジェクトを追い出すかの判断
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 100か国以上の1500を超えるネットワークに170,000台以上のサーバーがある ◦ 様々なサイズを配信する数千のプロバイダーから構成される ◦ リクエストパターンは時間によって大きく異なる ▪
日中時間帯はWebサイトのりように偏る ▪ 夜間はWebサイトに加え大容量なメディアファイルに偏る
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ すべてのオブジェクトがラウンドロビンで均等にアクセスされる環境があるとする ◦ メモリ容量が1GBの時にサイズが100 KBの小さなオブジェクトが10,000個あるとする ◦ 500MBのファイルが新たにリクエストされてキャッシュにAdmissionされる
▪ => 5000オブジェクトがEvictionしキャッシュヒット率が50%を下回る
AkamaiにおけるCDNの課題 • 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 何をEvictionするかではなく、なにをAdmissionするかが大事 ▪ これがAdaptSize(この論文)の前提となっている知識
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
AkamaiにおけるCDNの課題 • 先行研究や実運用におけるキャッシュヒット率の限界 ◦ 多くの研究は単位サイズ前提かevictionを中心として扱っている ▪ アドミッションに関しては軽視されがち ◦ 実運用は静的サイズ閾値が一般的 ▪
最適値への感度が高く、変化に追従できない ◦ 単純なヒルクライミング/固定確率は局所最適や応答遅れに陥りやすい
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
AkamaiにおけるCDNの課題 • AdaptSizeではマルコフ連鎖チューニングモデルを用いた ◦ アドミッション確率 p(size)=exp(-size/c)(サイズ依存。小さいほど入りやすい) ◦ 各オブジェクト i を
LRU 上の独立マルコフ連鎖でモデル化 ◦ 上昇率 r_i(リクエスト率)と押下率 μ_c(平均場;c に依存)から P_i(in-cache) を閉形式で導出 ◦ P_i(in-cache) = { (exp(r_i/μ_c) - 1) * exp(-c * s_i) } / { 1 + (exp(r_i/μ_c) - 1) * exp(-c * s_i) } ◦ 容量制約 Σ_i P_i * s_i = K を満たすよう μ_c を解き、OHR(c) を評価 ◦ OHR を最大化する c をグローバル探索(例:Δ=250K req ごとに更新) •
AkamaiにおけるCDNの課題 • AdaptSizeではマルコフ連鎖チューニングモデルを用いた ◦ アドミッション確率 p(size)=exp(-size/c)(サイズ依存。小さいほど入りやすい) ◦ 各オブジェクト i を
LRU 上の独立マルコフ連鎖でモデル化 ◦ 上昇率 r_i(リクエスト率)と押下率 μ_c(平均場;c に依存)から P_i(in-cache) を閉形式で導出 ◦ P_i(in-cache) = { (exp(r_i/μ_c) - 1) * exp(-c * s_i) } / { 1 + (exp(r_i/μ_c) - 1) * exp(-c * s_i) } ◦ 容量制約 Σ_i P_i * s_i = K を満たすよう μ_c を解き、OHR(c) を評価 ◦ OHR を最大化する c をグローバル探索(例:Δ=250K req ごとに更新) • よくわかり ませんでし た。。 続きは議論 で...
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
評価手法 • トレースベースシミュレーション+プロトタイプ実装ベンチ ◦ Varnish・Nginx • Akamaiプロダクショントレース ◦ HK: 4.5億
req / 157.5 TiB / 2,500万 objects ◦ US: 4.4億 req / 152.3 TiB / 5,500万 objects • メモリ1.2 GiB、C++シミュレータで各方式のOHRを比較 • 比較対象: Nginx / Varnish / 研究系8手法 / 将来知識ありの SIZE-OPT
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
評価結果 • オンメモリキャッシュヒット率の上昇 ◦ vs Varnish: +47~91% / vs Nginx:
+30~48% ◦ SIZE-OPT の95~99% をオンラインで達成
評価結果 • オンメモリキャッシュヒット率の上昇 ◦ 他の研究手法と比べても高いキャッシュヒット率の維持
評価結果 • 堅牢性 ◦ キャッシュヒット率を維持 ▪ 事前知識を持つSIZE-OPTと比較 • スパイクリクエスト: 95%
• 敵対的ミックス: 81% ◦ Randomized: 短期間に大量のトラフィックが急増するようなケース ◦ Adversarial: 性質の異なるアクセスを繰り返す(Web⇔動画)
評価結果 • 副作用なし/好影響 ◦ DCバイトヒット率は維持、ディスク利用率 −20% / IOPS −10% ◦
E2Eレイテンシ短縮(中央値 −43%, 高分位でも −30%超)
本日の発表の流れ • 自己紹介 • Akamaiとは • AkamaiにおけるCDNの課題 ◦ 「CDNの最大の課題はメモリから配信されるキャッシュヒット率の最適化」 ◦
CDNゆえのキャッシュヒット率向上の課題を複雑にする要素がある ◦ 異なるサイズのオブジェクトのキャッシュ効率を上げるのは難しい ◦ 先行研究や実運用におけるキャッシュヒット率の限界 ◦ AdaptSizeではマルコフ連鎖チューニングモデルを用いた • 評価 ◦ 評価手法 ◦ 評価結果 • まとめと議論
まとめと議論 • CDNでは時間帯によってリクエストパターンが異なる • その中でメモリ上のキャッシュヒット率を向上させる必要がある • 異なるオブジェクトを対象としたキャッシュヒット率ではadmissonが大事 ◦ 限られたメモリに大きなファイルを入れるとそれだけでキャッシュヒット率が落ちるため ◦
十分アクセスされる大きなファイルだけを入れる必要がある • 既存の研究ではevictionに焦点を当てたものが多い • AdaptSizeではadmissiionに焦点を当てた • 事前知識がある SIZE-OPTと数ポイントしか性能劣化しない手法を考案した ◦ これが AdaptSize • Varnish統合ができ、非常に使い勝手が良い
議論 • bootjpはマルコフ連鎖の式がよくわからなかったので、詳しい人がいたらぜひ議論をし たいです。 •