HOMELv020 PySparkの `cache()` メソッドを呼び出した後、実際にデータがキャッシュされるタイミングはいつか。 2026年3月8日 Sparkの変換操作は遅延評価(Lazy Evaluation)されるため、アクションがトリガーされて初めて計算が走り、その過程でキャッシュが行われる。 「Silver」層のテーブルにおいて、重複排除(Deduplication)を行う際に使用するSpark関数はどれか。 Databricksの「System Tables」で、特定のテーブルへのアクセス履歴(誰がいつクエリしたか)を確認できるテーブルはどれか。