LLMの推論において、前のトークンの計算結果を再利用して高速化する手法はどれか。

KeyとValueの計算結果を保存(キャッシュ)しておくことで、重複計算を避ける技術。