強化学習において;報酬が時間的に遅れて得られる場合、現在のアクションがどれだけ未来の報酬に寄与したかを計算する仕組みを何というか。

報酬の割り当てを時間軸方向にスムーズに広げるテクニック。