強化学習手法「SAC (Soft Actor-Critic)」の特徴はどれか。

エントロピー正則化項を入れることで、探索(Exploration)を促進し、局所解への陥没を防ぎつつロバストな方策を学習する。