LLMの入力として画像・音声・動画・テキストを等価なトークンとして扱い;単一のトランスフォーマーで処理するモデルを何と呼ぶか。

GPT-4oやGeminiなどが該当し;異なる感覚情報をシームレスに理解する。