Transformerの推論時において;過去の計算結果を再利用することで計算量を削減するメモリ領域を何というか。

各デコードステップでの重複計算を避け;推論の効率化を図る。