HOMELv028 シグモイド関数を多層ネットワークの隠れ層で使うと起きやすい問題はどれか。 2026年3月13日 シグモイド関数の微分最大値は0.25であり、層を経るごとに勾配が1/4以下に減衰していくため、入力層付近で学習が進まなくなる。 最適化手法「Momentum SGD」の更新式に含まれる項はどれか。 CNNにおいて「ストライド(Stride)」を1から2に増やすとどうなるか。