モデルが以前のトークンを考慮して次のトークンを生成するプロセスを何と呼ぶか。

LLMの多くは、それまでに生成した単語を元に次の単語を予測する自己回帰的な仕組みを持つ。