強化学習において、現在の状態から将来得られる報酬の合計（割引あり）を何と呼ぶか。

2026年4月3日

割引率 γ を用いた累積報酬の和が収益である。

画像認識モデルにおいて、空間的な位置関係を保持したままチャンネル間の情報を統合する手法はどれか。

ROC曲線が(0,0)から(1,1)を結ぶ直線（対角線）に一致する場合、そのモデルの性能はどう評価されるか。