勾配の一次モーメントと二次モーメントの指数移動平均を用いてパラメータごとに学習率を適応的に調整する深層学習の最適化手法はどれか。

過去の勾配の平均と分散の両方を考慮することでノイズの多いデータやスパースなデータに対しても効率的に学習を進める。