HOMELv020 二値分類の予測値が確率であるとき、正解ラベルとの「近さ」を測る最も一般的な損失関数はどれか。 2026年4月3日 ベルヌーイ分布の対数尤度に基づくこの関数が分類の標準である。 学習率のウォームアップ(Warmup)を行う目的はどれか。 ニューラルネットワークにおいて、勾配が「爆発」することを防ぐ最も直接的な手法はどれか。