HOMELv009 強化学習において、エージェントが行動を選択し、環境から得られる報酬を最大化するためのルールを何と呼ぶか。 2026年1月25日 方策(ポリシー)は、ある状態でどのような行動をとるかを決める戦略である。 マーケティングにおいて、顧客1人が生涯を通じて企業にもたらす利益の総額を何と呼ぶか。 クラウドの責任共有モデルにおいて、一般的にSaaS利用者が責任を負う範囲はどれか。