LLMの「コンテキストウィンドウ」を拡張するための技術として知られるものはどれか。

メモリ消費を抑えつつ高速にAttentionを計算するアルゴリズム。