LLMのコンテキスト長を「無限」に拡張しようとする試みにおいて;アテンションの一部を「圧縮された記憶」として保持する構造を何というか。

過去の情報をすべて保持する代わりに;重要な情報を要約して残す。