LLMの性能を維持したまま、推論時の計算負荷が高い「Softmax」計算を避けるために提案されている手法はどれか。

カーネル法や線形代数の性質を利用し;長いシーケンスに対する計算を効率化する。