Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Transformerの推論を線形時間にして皆を驚かせましょう

Avatar for 小島瑞貴 小島瑞貴
May 30, 2026
25

 Transformerの推論を線形時間にして皆を驚かせましょう

Avatar for 小島瑞貴

小島瑞貴

May 30, 2026

Transcript

  1. 7 状態をNNで表現するのは妥当…? 1/2 目的は、Transformerの状態の圧縮 Transformer: ☛ 状態は今までのキーとバリューの保存 ☛ 特徴量はクエリqに対して、キーとの類似度によるバリューの重みづけ 本手法:

    キーをバリューに結び付ける関数 を学習 ☛ 特徴量は、クエリqに対して、関数 の入力とする ☛ (入力である)キーとの類似度で、(重みづけ後の)特徴量が出てくる