HOMELv043 「Group Normalization」がBatch Normalizationより有利になる状況はどれか。 2026年3月13日 GNはバッチ方向に依存せず計算するため、物体検出などメモリ制約でバッチサイズを小さくせざるを得ないタスクで精度が安定する。 「ウォームアップ(Warmup)」と呼ばれる学習率スケジュールの目的はどれか。 CNNにおける「1×1畳み込み」の主要な用途の一つはどれか。