「マルチモーダル学習」とはどのような学習か。

視覚と言語など、異なるモダリティ(様式)の情報を相互に関連付けることで、より豊かな表現学習やタスク解決を目指す。