学習済みの巨大なモデル(教師)の出力確率分布を;小さなモデル(生徒)が再現するように学習する手法はどれか。

高性能なモデルを軽量化し;スマホ等で動かせるようにする。