ms / 578 runs ( 46.10 ms per token, 21.69 tokens per second) – llama_perf_context_print: total time = 27707.62 ms / 626 tokens • CPUのみ – llama_perf_context_print: eval time = 133206.50 ms / 527 runs ( 252.76 ms per token, 3.96 tokens per second) – llama_perf_context_print: total time = 140521.50 ms / 572 tokens • 生成速度が5倍くらいに