LLMの推論において；「小さなドラフトモデル」で仮の回答を作り；「大きなモデル」で一括検証することで高速化する技術を何というか。

2026年1月25日

大きなモデルの推論回数を減らし；トータルのスループットを向上させる。

Transformerの各層で実行される「層正規化（Layer Norm）」において；平均値を引かずに分散（RMS）のみで正規化し計算を効率化する手法はどれか。

AIによるビデオ生成において；フレーム間の「一貫性」を保つため；時間軸方向のアテンションを計算する際の単位を何と呼ぶか。