LLMのAPIの応答時間を予測し;レスポンスが遅い場合に自動でプロンプトを簡略化して再試行する負荷分散手法を何というか。

ユーザー体験(UX)を維持するための運用上の工夫。