モデルが大きすぎる場合に、より小さなモデル(生徒)に知識を継承させる手法はどれか。

教師モデルの出力を生徒モデルが模倣するように学習させる。