LLMのコンテキスト長を「無限」に近づける際;アテンションの一部を「圧縮された記憶(サマリー)」として保持する手法を何というか。

過去の情報をすべて保持する代わりに;重要な情報を要約して残す技術。