LLMを実運用する際;入力される質問を複数の小さなLLMでフィルタリングし;本当に必要な時だけ巨大なLLMを動かす構成を何というか。

コストと精度の最適化を図るための実務的な構成。