強化学習における「World Models」のアプローチの特徴はどれか。

環境のダイナミクスを学習したモデル(世界モデル)内でエージェントを訓練することで、実環境での試行回数を減らし安全に学習できる。