HOMELv028 Batch Normalizationが推論時(テスト時)に使用する平均と分散はどれか。 2026年3月13日 推論時はデータが1つずつ来ることもあるため、バッチ統計量は使えず、学習中に蓄積した移動平均などの固定値を使う。 ドロップアウト率0.5の意味はどれか。 最適化手法「Momentum SGD」の更新式に含まれる項はどれか。