強化学習における「報酬シェイピング(Reward Shaping)」の目的はどれか。

ゴールに到達した時だけの疎な報酬(Sparse Reward)では学習が困難な場合に、中間目標など補助的な報酬を設計して学習を助ける。