HOMELv018 最適化手法「SGD with Momentum」におけるモーメンタム項の役割はどれか。 2026年3月13日 物理的な慣性のように、過去の移動方向を維持する項を加えることで、ジグザグした動きを抑えて収束を早める。 Batch Normalizationのパラメータ(スケールγとシフトβ)はどのように決定されるか。 ドロップアウトをテスト(推論)時に適用しない場合、一般的にどのような調整が必要か。