LLMのトークナイザーにおいて;単語を構成する「バイト(Byte)」レベルで処理を行い、未知語を完全に無くす手法はどれか。

GPT-2以降のモデルで採用されており;あらゆるテキストを処理可能にする。