LLMのパラメータを16bitから8bitや4bitに減らしても性能が維持されやすいのはなぜか。

深層学習モデルには高い冗長性があり、多少の精度低下が全体の性能に響きにくいため。