HOMELv008 最適化手法「AdaGrad」の特徴的な挙動はどれか。 2026年3月13日 頻繁に更新されるパラメータの学習率を大きく下げ、更新が少ないパラメータの学習率を保つことで、適応的な更新を行う。 学習における「1エポック(Epoch)」の定義はどれか。 学習データに対する誤差もテストデータに対する誤差も大きい状態を何と呼ぶか。