重みの値を {-1, 0, 1} の3値に制限し;1.58ビット相当の精度で動作する大規模言語モデルのアーキテクチャはどれか。

BitNet b1.58は;従来のFP16モデルに匹敵する性能を保ちつつ;計算コストを劇的に削減する。