モデルの精度を維持しつつ、重みの精度を32bit浮動小数点から8bit整数などに下げる技術はどれか。

量子化はモデルのサイズを削減し、推論速度を向上させる。