LLMの推論において;「小さなドラフトモデル」で仮の回答を作り;「大きなモデル」で一括検証することで高速化する技術を何というか。

大きなモデルの推論回数を減らし;トータルのスループットを向上させる。