知識蒸留などで使われる、ソフトマックス関数の「温度(Temperature)」パラメータTを高くするとどうなるか。

T>1で割ることで確率差が縮まり、正解以外のクラスが持つ相対的な情報(ダークナレッジ)が現れやすくなる。