強化学習において、エージェントが行動を決定するためのルールや確率を何と呼ぶか。

ある状況下でどのような行動を選択するかを定義した、学習の核心となる戦略。