Amazon S3のデータをSageMakerで学習する際、データセットが数百万の小さなファイルで構成されている場合に、I/Oパフォーマンスを最大化するために推奨されるデータ形式はどれか。

RecordIO形式は複数のレコードを1つのバイナリファイルにまとめるため、小さなファイルによるオーバーヘッドを削減できます。