強化学習において;エージェントが「直接的な報酬」が得られない間も;「どれだけゴールに近づいたか」という補助的な報酬を与える手法を何というか。

報酬が稀な(スパースな)課題の学習を加速させるテクニック。