ニューラルネットワークの「学習の速さ」を動的に調整する際;「過去の勾配の蓄積」を利用して、よく動くパラメータの学習率を下げ、あまり動かないパラメータの学習率を上げる手法はどれか。

パラメータごとに最適な学習率を自動調整し;収束を早める。