LLMのAPI利用において;同じ指示(システムプロンプト)が繰り返される場合に;最初の処理結果を再利用してコストと遅延を削減する技術はどれか。

定型的な長い指示をキャッシュすることで;スループットを向上させる。