強化学習において;エージェントが「未来の報酬」をどの程度重視するかを決定する「割引率」の値を1に近づけるとどうなるか。

1に近いほど長期的視野で行動し;0に近いほど近視眼的な行動をとる。