強化学習において、現在の行動が将来の報酬に与える影響を考慮するための係数を何というか。

将来得られる報酬を現在の価値に換算するためのパラメータです。