ニューラルネットワークの「情報の圧縮」を数学的に解析し;学習とは「予測に不要な情報を削除する過程」であるとする理論はどれか。

Tishbyらによって提唱された;深層学習の汎化性能を説明する有力な仮説の一つ。