学習率をパラメータごとに自動で調整し、過去の勾配の2乗和を利用する最適化手法は何か。

Adaptive Gradientの略。