HOMELv011 強化学習において、現在の状態に基づいて行動を決定する仕組みを何というか。 2026年4月27日 エージェントがどの状態でどの行動を選択するかを規定するルールである。 ∫ e^x dx の結果として正しいものはどれか(Cは積分定数)。 log10(2) = 0.3010 とするとき、5^10 は何桁の数か。