強化学習のDDPG(Deep Deterministic Policy Gradient)が対象とする行動空間はどれか。

DQN等の手法は離散的な行動しか扱えないが、DDPGはActor-Critic法を用いて、ロボット制御などの連続値の行動出力に対応する。