HOMELv018 ドロップアウトをテスト(推論)時に適用しない場合、一般的にどのような調整が必要か。 2026年3月13日 学習時は一部のニューロンが消えていたため、全ニューロンを使う推論時は出力の総和が大きくなりすぎるので、比率を合わせて調整する。 最適化手法「SGD with Momentum」におけるモーメンタム項の役割はどれか。 重み減衰(Weight Decay)は、損失関数に何を加えることと等価か。