モデルの重みを4ビット以下に量子化しつつ;学習可能な低ランク行列のみを更新することでメモリ効率を極大化した手法はどれか。

QLoRAは4ビット量子化とLoRAを組み合わせた効率的な微調整手法である。