Spark DataFrameに対して、Pythonのネイティブなライブラリ(scikit-learn等)を使って並列処理を行うために使用する機能はどれか。

Pandas UDFを使用すると、Apache Arrowを利用してデータを効率的に転送し、各ノードでPandas/Scikit-learnのコードを並列実行できる。