HOMELv003 環境との相互作用を通じて報酬を最大化するように学習する手法はどれか。 2026年3月22日 強化学習は試行錯誤を通じて最適な行動を選択できるようにする学習方法である。 プロンプトを工夫してAIからより良い回答を引き出す技術を何と呼ぶか。 Marketing Cloudで顧客に最適な送信タイミングを推奨する機能はどれか。