LLMのAPIコストを削減するために;「似たような質問」が来た際に過去の回答を返す仕組みにおいて;ベクトルの「コサイン類似度」を用いて判定することを何というか。

文字列の完全一致ではなく;「意味の近さ」でキャッシュをヒットさせる。