ファインチューニングを複数行い θ 1 , θ 2 , …, θ n を得て、平均 を用いる このモデルは θ 1 , θ 2 , …, θ n よりも性能が高く頑健である なぜ? Mitchell Wortsman, Gabriel Ilharco, Samir Yitzhak Gadre, Rebecca Roelofs, Raphael Gontijo Lopes, Ari S. Morcos, Hongseok Namkoong, Ali Farhadi, Yair Carmon, Simon Kornblith, and Ludwig Schmidt. Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time. ICML 2022.