【シナリオ】Lakehouse Monitoringのダッシュボードで、ある特徴量の「NULL率」が急増したアラートを受け取った。原因を追うと、上流のETLジョブでスキーマ変更があったことが判明した。今後これを防ぐための、MLパイプラインとデータパイプラインの連携手法はどれか。

データプロデューサー(ETL側)とコンシューマー(ML側)の間でスキーマや品質基準を「Data Contract」として定義・強制し、違反データがMLパイプラインに流れる前にブロックまたは通知する仕組みが必要である。