HOMELv030 Amazon S3のデータをSageMakerで学習する際、データセットが数百万の小さなファイルで構成されている場合に、I/Oパフォーマンスを最大化するために推奨されるデータ形式はどれか。 2026年3月3日 RecordIO形式は複数のレコードを1つのバイナリファイルにまとめるため、小さなファイルによるオーバーヘッドを削減できます。 Amazon SageMakerの「XGBoost」アルゴリズムで、各ステップでの学習を調整するパラメータである「eta(学習率)」を小さく設定した場合、併せてどのパラメータを増やすことが一般的か。 多クラス分類の混同行列において、特定のクラスに対する「偽陰性(False Negative)」は行列のどこに示されるか。