「知識蒸留(Knowledge Distillation)」における教師モデルと生徒モデルの関係はどれか。

高性能だが重いモデル(教師)の出力確率(ソフトターゲット)を、軽いモデル(生徒)の正解ラベルとして学習させ、軽量化と精度維持を図る。