ニューラルネットワークの「情報の伝播」をスムーズにするために;各層の重みの分布を学習可能なパラメータで調整する手法を何というか。

Layer NormやRMSNormなどが;Transformerの安定した学習を支えている。