HOMELv086 LLMの推論において;「小さなドラフトモデル」で仮の回答を作り;「大きなモデル」で一括検証することで高速化する技術を何というか。 2026年1月25日 大きなモデルの推論回数を減らし;トータルのスループットを向上させる。 Transformerの各層で実行される「層正規化(Layer Norm)」において;平均値を引かずに分散(RMS)のみで正規化し計算を効率化する手法はどれか。 AIによるビデオ生成において;フレーム間の「一貫性」を保つため;時間軸方向のアテンションを計算する際の単位を何と呼ぶか。