HOMELv044 重みの値を {-1, 0, 1} の3値に制限し;1.58ビット相当の精度で動作する大規模言語モデルのアーキテクチャはどれか。 2026年1月25日 BitNet b1.58は;従来のFP16モデルに匹敵する性能を保ちつつ;計算コストを劇的に削減する。 LLMの計算効率を向上させるため;特定のトークンに対してのみデコーダの全層を通し;重要度の低いトークンは層をスキップさせる手法はどれか。 静止画ではなく動画とテキストを理解し;ロボットの関節角度などの「アクション」を直接出力する基盤モデルを何というか。