HOMELv025 モデルの重みの L2 ノルムを損失に加える手法において、重み更新式で重みを直接減衰させる項が現れることから何と呼ばれるか。 2026年4月3日 L2正則化の勾配をとると、現在の重みに比例した減衰項が現れる。 Transformerの学習において、初期段階で学習率を徐々に上げる「ウォームアップ」を適用しないとどうなりやすいか。 決定木アルゴリズムの C4.5 が ID3 から改良された点の一つはどれか。