「Speculative Decoding(投機的デコード)」という高速化技術の概要はどれか。

軽量なモデルで下書きを作り、強力なモデルで確認することで、高い精度を保ちつつ速度を向上させる。