Transformerにおいて;入力が非常に長い場合に計算量を削減するため;窓(Window)を設けてその中だけで注目(Attention)を行う手法はどれか。

計算コストを線形に抑え;長いドキュメントを扱えるようにする工夫。