初心者にもわかりやすく、ChatGPTをはじめとした近年話題のLLM (Large Language Model)の中身について解説します。また、LLMを大規模に学習するだけではなく、LLMを動かして利用すること(推論)が重要になりつつあることを踏まえ、LLMの推論システムのサービングが難しい理由と、それに対応するための小規模化や量子化などの最近のモデルデータサイズを減らす工夫についてもお話しします。
イベントサイト: https://event.cloudnativedays.jp/cndw2024