エッジコンピューティングにおいて、AIモデルを軽量化して端末に配布する際によく使われる手法はどれか。

演算精度を落とす「量子化」や、不要な結合を削る「枝刈り」等により、実行負荷を低減する。