モデルの学習において、パラメータを少しずつ更新して損失関数を最小化する際、局所解(ローカルミニマ)に捕まるリスクがあるアルゴリズムはどれか。

非凸な関数の場合、勾配が0になる地点が必ずしも全体の最小値とは限らない。