HOMELv017 強化学習における「探索(Exploration)」と「利用(Exploitation)」のトレードオフを調整する最も代表的な手法はどれか。 2026年3月11日 一定の確率(ε)でランダムに行動し、それ以外で現時点の最適行動を取ることで未知の報酬を探します。 BigQueryにおいて、多数の小さなファイルを読み込むよりも、大きな1つのファイルを読み込む方が効率的な理由はどれか。 Vertex AIで学習を行う際、Cloud Storage上のデータを「マウント」してローカルファイルのように扱うための仕組みはどれか。