HOMELv012 学習率をパラメータごとに自動で調整し、過去の勾配の2乗和を利用する最適化手法は何か。 2026年3月3日 Adaptive Gradientの略。 勾配降下法において、極小値(ローカルミニマム)に陥る問題を避けるために以前の更新量を加味する手法は何か。 モーメンタムとAdaGradの考え方を組み合わせた、現在最も広く使われている最適化手法は何か。