AIモデルのパラメータの数値を、高い精度(32bit等)から低い精度(8bit等)に変換して計算負荷を抑える手法はどれか。

量子化(Quantization)は、精度を一定に保ちつつ、メモリ消費と演算速度を改善する。