強化学習において、現在の状態から将来得られる報酬の合計(割引あり)を何と呼ぶか。

割引率 γ を用いた累積報酬の和が収益である。