2026年現在のAIトレンドにおいて、テキストだけでなく画像、音声、動画を同時に処理・理解できるAIを何と呼ぶか。

複数の形式(モード)の情報を統合的に扱うAIをマルチモーダルAIと呼ぶ。