HOMELv043 知識蒸留などで使われる、ソフトマックス関数の「温度(Temperature)」パラメータTを高くするとどうなるか。 2026年3月13日 T>1で割ることで確率差が縮まり、正解以外のクラスが持つ相対的な情報(ダークナレッジ)が現れやすくなる。 RNNの学習で、長い系列に対して勾配計算を途中で打ち切る手法を何と呼ぶか。 「Early Stopping(早期終了)」を実行するための適切な監視対象はどれか。