HOMELv009 【シナリオ】MLパイプラインのジョブが「リソース不足(Out of Memory)」で失敗することがある。クラスター構成を変更せずに、ジョブの設定だけで信頼性を向上させる方法はどれか。 2026年3月8日 OOMが一時的なスパイクによるものであれば、Retries(再試行)ポリシーを設定することで、一時的な失敗を乗り越えてジョブを成功させることができる(根本解決にはクラスタサイズ検討も必要だが、設定だけで信頼性を上げる第一歩はRetry)。 【シナリオ】Hyperoptでの探索が特定の領域(局所解)に留まってしまい、大域的な最適解が見つからない可能性がある。探索の多様性を高めるために調整すべきパラメータやアプローチはどれか。 【シナリオ】トレーニング時にはバッチ処理で作成された特徴量を使用し、推論時にはリアルタイムで計算される特徴量(例:セッション中のクリック数)を使用したい。Feature Storeでこれを実現する概念はどれか。