LLMのパラメータを保存する際;メモリ消費を抑えるために4ビットや8ビットに圧縮して保持する手法はどれか。

浮動小数点の精度を落とすことで;巨大なモデルを一般のGPUで動かせるようにする。