深層学習において、各層の重みの初期値が大きすぎたり小さすぎたりすることで、勾配が極端になる問題を何というか。

初期値の設定や活性化関数の選択が適切でないと、勾配が伝播しなくなる、あるいは発散してしまいます。