従来の「トークン」単位ではなく、文字のバイト配列を直接処理することで、未知の単語や多言語への対応力を高めた言語モデルのアプローチはどれか。

トークン化の工程を省きバイト単位で処理する手法は、複雑な文字体系の理解に寄与する。