LLMに非常に長いドキュメントを読み込ませる際;すべてのトークンに注意を向けるのではなく;過去の重要な情報だけを圧縮して保持する仕組みはどれか。

数百万トークンといった超長文を一定のメモリ量で処理するための最新技術。