HOMELv018 Batch Normalizationのパラメータ(スケールγとシフトβ)はどのように決定されるか。 2026年3月13日 正規化されたデータを適切な範囲にシフト・スケーリングするために、γとβも学習可能なパラメータとして最適化される。 活性化関数「Swish」の特徴はどれか。 最適化手法「SGD with Momentum」におけるモーメンタム項の役割はどれか。