モデルの「汎化性能」を評価するために;訓練には一切使わず最後まで取っておくデータのことを何というか。

学習中の調整にも使わない純粋な評価用データ。