LLMの運用において;推論コストを削減するために;「似たような質問」に対する回答をセマンティック(意味的)に検索して再利用する機能を何というか。

LLMの呼び出し回数を減らし;応答速度とコストを改善する。