本資料ではSleep-time Computeについて紹介します。
Sleep-time Computeは事前に(Sleep-time)コンテキスト情報を処理しておくことで、実際の(Test-time)推論コストを削減する方法です。
arXivはこちらです。
https://arxiv.org/abs/2504.13171
本資料は以下イベントのLTで使用したスライドです。
https://tc3.connpass.com/event/351598/