Amazon SageMakerの「Image Classification」において、学習を高速化するために複数のGPUにバッチを分割して処理させる手法はどれか。

データ並列は、異なるデータのバッチを各GPUで同時に計算し、最後に勾配を同期させる手法。