知識蒸留において、教師モデルが出力する確率分布(ソフトターゲット)を使う利点はどれか。

単なる正解ラベル(ハードターゲット)よりも、「犬は猫に似ているが車には似ていない」といった詳細な知識(ダークナレッジ)を生徒に伝達できる。