HOMELv007 強化学習において、エージェントが最大の報酬を得るために取るべき行動を決定する関数はどれか。 2026年3月11日 方策は特定の状態においてエージェントがどの行動を選択するかを定義する戦略です。 Vertex AI Datasetにおいて、アノテーション(ラベル付け)作業を外部の作業者に依頼できるサービスはどれか。 BigQuery MLにおいて、ハイパーパラメータ調整の結果を詳細に確認するために使用する関数はどれか。