エージェントが報酬を最大化するために;「今の状態からゴールまで」を予測するのではなく、「ゴールから逆向きに」考える手法を何というか。

長いステップが必要な課題において;効率的に探索を進めるための手法。