LLMのAPIの応答時間を予測し;レスポンスが遅い場合に自動で「軽いモデル」に切り替える手法を何というか。

ユーザー体験(UX)を維持するための運用上の工夫。