LLMを実運用する際;入力プロンプトが巨大になり「コンテキスト長」をオーバーするのを防ぐために、古い情報を圧縮・要約する機能を何というか。

重要な情報を維持したまま、トークン数を削減してコストと計算量を抑える。