a pen.」 「This is a pen. That」から「is」を予測。 次のトークンを予測することに特化している 次にくるトークンを予測することを繰り返して、文章が出来上がる。 → 生成タスクが得意になる。 https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
a pen.」 「This is a <MASK>. That is not a pen」から「pen」を予測。 「This is a pen.」の後に「That is not a pen.」が続きかどうかを予測。 文章の理解に特化している 文章全体を把握する能力が身につく。 → 分類や質疑応答などのタスクが得意になる。 https://arxiv.org/abs/1810.04805