Transformerの推論時において；過去の計算結果を再利用することで計算量を削減するメモリ領域を何というか。

2026年1月25日

各デコードステップでの重複計算を避け；推論の効率化を図る。

LLMの推論を高速化するために；小さなモデルで下書きを作成し大きなモデルで検証する手法はどれか。

画像生成AIにおいて；U-Netの代わりにTransformerブロックを用いたアーキテクチャ（DiT）の名称はどれか。