HOMELv018 活性化関数「Swish」の特徴はどれか。 2026年3月13日 Googleによって探索された関数で、非単調かつ滑らかな形状をしており、特に深いネットワークでReLUを超える性能を示すことがある。 ニューラルネットワークの学習において「プラトー(Plateau)」とはどのような状態か。 Batch Normalizationのパラメータ(スケールγとシフトβ)はどのように決定されるか。