強化学習における「探索（Exploration）」と「利用（Exploitation）」のトレードオフを調整する最も代表的な手法はどれか。

2026年3月11日

一定の確率（ε）でランダムに行動し、それ以外で現時点の最適行動を取ることで未知の報酬を探します。

BigQueryにおいて、多数の小さなファイルを読み込むよりも、大きな1つのファイルを読み込む方が効率的な理由はどれか。

Vertex AIで学習を行う際、Cloud Storage上のデータを「マウント」してローカルファイルのように扱うための仕組みはどれか。