AIの計算処理を高速化するため、32ビット浮動小数点のパラメータを8ビット整数などに変換し、メモリと計算負荷を削減する技術はどれか。

量子化(Quantization)は、精度への影響を抑えつつモデルを軽量化し、エッジデバイスでの実行を助ける。