ディープラーニングの「蒸留 (Distillation)」において、教師モデルが出力する確率分布(Soft target)に含まれる「暗黙の知識」を生徒モデルに伝えるために調整するパラメータはどれか。

温度パラメータにより確率分布を滑らかにし、知識を伝達しやすくする