HOMELv025 PySparkのUDF内で、大きな辞書データなどを参照する際に、単なるグローバル変数として定義するのではなく `Broadcast Variable` を使うべき理由はどれか。 2026年3月8日 ブロードキャストしない場合、変数はタスク(スレッド)ごとにシリアライズされて送られる可能性があり、ネットワーク転送量とメモリ消費が激増する。 Databricks Asset Bundles (DABs) で、ワークフロー定義を記述するために使用される言語フォーマットはどれか。 「Hub-and-Spoke」型データアーキテクチャにおいて、中央のハブ(Hub)が提供する機能はどれか。