LLMの性能を維持したまま、推論時の「行列演算」をビット演算などに置き換えて劇的に高速化する研究手法(例:1-bit LLM)はどれか。

パラメータを{-1, 0, 1}などの極めて少ない値に制限し;専用ハードウェアでの超高速化を目指す。