複数のAIモデルを並列に動かし;最も早く、または最も精度の高い回答を出したモデルの結果を採用するインフラ構成を何というか。

リアルタイム性が重視されるサービスでの運用手法。