エージェントが未知の行動を試す「探索」と;過去の経験から高い報酬を得る「利用」のバランスを何というか。

強化学習における重要な戦略的課題である。