LLMアプリケーションにおいて;あらかじめ特定の回答(FAQなど)を用意しておき;ユーザーの質問の「意味的な近さ」をベクトルで判定して回答を出す手法を何というか。

LLMを呼び出すコストと時間を節約するための高度なキャッシュ。