HOMELv040 強化学習手法「SAC (Soft Actor-Critic)」の特徴はどれか。 2026年3月13日 エントロピー正則化項を入れることで、探索(Exploration)を促進し、局所解への陥没を防ぎつつロバストな方策を学習する。 メタ学習手法「MAML (Model-Agnostic Meta-Learning)」の核心的なアイデアはどれか。 グラフニューラルネットワークの「GraphSAGE」の特徴はどれか。