PySparkの `cache()` メソッドを呼び出した後、実際にデータがキャッシュされるタイミングはいつか。

Sparkの変換操作は遅延評価(Lazy Evaluation)されるため、アクションがトリガーされて初めて計算が走り、その過程でキャッシュが行われる。