「Vision Transformer (ViT)」において、クラス分類の結果を得るために使われるトークンはどれか。

BERTと同様に、入力の先頭に追加した特別な[CLS]トークンに対応する出力ベクトルを、画像全体の特徴表現として分類層に入力する。