Databricksにおける分散深層学習で、`Horovod` と `TorchDistributor` (DDP) の通信バックエンドとして一般的に使用されるプロトコルはどれか。

GPU間の高速な通信(AllReduceなど)を実現するために、NVIDIAのNCCL(Nickel)バックエンドが標準的に使用される。