HOMELv009 強化学習において、エージェントが行動を選択する基準となる関数はどれか。 2026年3月3日 Policy。 転置行列 A^T について (A^T)^T は何か。 行列Aが正則であるための条件はどれか。