HOMELv027 主成分分析(PCA)を適用する前に、データを「平均0、分散1」に正規化(標準化)すべき主な理由はどれか。 2026年3月3日 PCAは分散を最大化する方向を探すため、スケールの大きい変数に結果が引きずられないように標準化が必要です。 Amazon EMRでApache Sparkジョブを実行する際、一部のタスクが他のタスクより極端に長くかかる「データスキュー(偏り)」を軽減するためのSparkの機能はどれか。 Amazon SageMakerの組み込み「Image Classification」アルゴリズムにおいて、非常に少ない画像データで高い精度を出すために推奨される学習オプションはどれか。