LLMに非常に長いドキュメントを読み込ませる際;アテンションの計算範囲を制限してメモリ消費を線形に抑える構造を何というか。

Mistral 7Bなどで採用され;長いコンテキストの効率的な処理を可能にする。