HOMELv017 `StandardScaler` を使用して特徴量を正規化する際、トレーニングセットで計算された平均と標準偏差を、テストセットの変換時にも使用するのはなぜか。 2026年3月8日 テストデータや推論データのスケーリングには、必ずトレーニングデータから得られた統計量(平均・分散)を適用しなければならない。そうしないと、基準がずれてモデルの予測が無意味になる。 【シナリオ】MLflowで実験を行っている際、誤って非常に大きなアーティファクト(数GBのモデルファイルなど)をログしてしまい、ストレージ容量を圧迫している。これらを削除するための推奨される方法はどれか。 DatabricksでGPUクラスターを使用しているが、PyTorchのトレーニングがGPUを認識せず、CPUで実行されているように見える。まず確認すべきクラスタ設定はどれか。