ドロップアウトをテスト（推論）時に適用しない場合、一般的にどのような調整が必要か。

2026年3月13日

学習時は一部のニューロンが消えていたため、全ニューロンを使う推論時は出力の総和が大きくなりすぎるので、比率を合わせて調整する。

最適化手法「SGD with Momentum」におけるモーメンタム項の役割はどれか。

重み減衰（Weight Decay）は、損失関数に何を加えることと等価か。