深層学習モデルの軽量化手法「蒸留(Distillation)」の説明はどれか。

教師モデルの出力(確率分布)を生徒モデルに学習させ、知識を継承させる