異なる種類のデータ(テキストと画像など)を組み合わせて学習・処理するAIの形式を何と呼ぶか。

視覚、聴覚、言語など複数の情報の種類を統合して理解・生成できるAI。