HOMELv025 「Hub-and-Spoke」型データアーキテクチャにおいて、中央のハブ(Hub)が提供する機能はどれか。 2026年3月8日 ハブは組織全体で共有される信頼性の高いデータ(共通ディメンションやマスターデータ)を提供し、各スポーク(部署)はそれを参照して独自分析を行う。 PySparkのUDF内で、大きな辞書データなどを参照する際に、単なるグローバル変数として定義するのではなく `Broadcast Variable` を使うべき理由はどれか。 Databricksの「Serverless SQL Warehouse」が、クエリ実行時に自動的に使用するパフォーマンス最適化機能はどれか。