強化学習における「探索(Exploration)」と「利用(Exploitation)」のトレードオフの説明はどれか。

より良い報酬を求めて新しいことを試すか、今の知識で最善を尽くすかのジライマ。