リソース制約のあるエッジデバイス(モバイル等)でモデルを実行するために、重みの精度を落とす手法はどれか。

量子化(Quantization)は32bit浮動小数点を8bit整数等に変換し、モデルサイズと演算負荷を削減します。