LLMの推論コストを下げるために、数値の精度(浮動小数点)を落とす手法を何と呼ぶか。

FP32からINT8などに変換することで、メモリ使用量と計算量を削減する。