cuDNN 8.9.7, nccl 2.20.5 torch 2.3.1, TE v1.9 日本語コーパスの改善 ablation実験 ablation実験は同一の環境で実施 前versionとのloss, grad normの差を検証 FLOP/s, forward, backward時間も検証 時間軸 CUDA Toolkit 12.4, cuDNN 9.1.0, nccl 2.21.5 torch 2.5.1, TE v1.11 コードコーパスの改善 ablation実験 実験環境ごとに tag 管理(Github) Swallow Project管理下 総計 42 tags (Pre-training)