エッジAI(Edge AI)において、モデル軽量化のために行われる「量子化」の説明はどれか。

量子化は、通常32bit浮動小数点で扱われる重みや演算を、8bit整数などに変換し、メモリ削減と計算高速化を図る技術である。