AIモデルの軽量化手法「量子化(Quantization)」において、Post-training Quantizationとはいつ行うか。

再学習を行わず、学習済みの重みパラメータを変換して量子化する手法で、手軽にモデルサイズを削減できる。