自然言語処理において、文章を単語や文字などの最小単位に分割する処理を何と呼ぶか。

トークン化は、テキストデータを機械学習モデルが処理できる単位(トークン)に分解する最初のステップである。