HOMELv027 【シナリオ】Spark MLlibの `GMM` (Gaussian Mixture Model) を使用してクラスタリングを行っているが、初期値によって結果が大きく変動してしまう。結果の安定性を高めるために調整すべきパラメータはどれか。 2026年3月8日 GMMはEMアルゴリズムを使用しており、初期化(ランダムな開始点)に敏感であるため、再現性と安定性を確保するには `seed` を固定することが重要である。 【シナリオ】数千の並列タスクを実行し、それぞれがMLflowにメトリクスをログする大規模な分散処理において、「APIレート制限」のエラーが頻発している。コードを変更せずにこの負荷を軽減する設定はどれか。 【シナリオ】Databricks上で、複数のGPUノードを使用して巨大な言語モデル(LLM)のファインチューニングを行いたい。DeepSpeedやMegatron-LMのような技術を簡単に適用するために、推奨されるDatabricksのライブラリ/構成はどれか。