LLMの推論を高速化するために;小さなモデルで下書きを作成し大きなモデルで検証する手法はどれか。

ドラフトモデルを用いて並列的に検証することで;精度を維持しつつ推論速度を向上させる。