LLMの性能を維持したまま、推論時の「行列演算」をビット演算などに置き換えて劇的に高速化する研究手法（例：1-bit LLM）はどれか。

2026年1月25日

パラメータを{-1, 0, 1}などの極めて少ない値に制限し；専用ハードウェアでの超高速化を目指す。

AIの推論サーバーにおいて；複数のユーザーからのリクエストを効率的に処理するために；バッチサイズを動的に調整する技術を何というか。

データの分布（平均と分散）が時間の経過とともに変化してしまう現象を何というか。