エージェントが未知の行動を試すことと、既知の収益の高い行動をとることのバランスを何と呼ぶか。

高い報酬を得るには、既存知識の利用と新しい行動の探索の両立が必要である。