モデルを軽量化してモバイルデバイスなどで実行できるようにする技術はどれか。

量子化は重みの精度を落とすことでモデルサイズを削減し計算速度を高速化する手法である。