重みの初期値としてガウス分布を用いる際、分散が大きすぎるとどのような問題が起きるか。

出力が活性化関数の飽和領域に達しやすく、学習が不安定になる。