PySpark UDF内で外部APIを呼び出す際のパフォーマンス上のボトルネックは何か。

通常のUDFで行ごとにAPIコールすると極めて低速になるため、`mapPartitions`などを使って接続を再利用するか、バッチAPIの使用を検討すべきである。