HOMELv043 LLMの性能を維持したまま、推論時の「行列演算」をビット演算などに置き換えて劇的に高速化する研究手法(例:1-bit LLM)はどれか。 2026年1月25日 パラメータを{-1, 0, 1}などの極めて少ない値に制限し;専用ハードウェアでの超高速化を目指す。 AIの推論サーバーにおいて;複数のユーザーからのリクエストを効率的に処理するために;バッチサイズを動的に調整する技術を何というか。 データの分布(平均と分散)が時間の経過とともに変化してしまう現象を何というか。