計算リソースを最適化するため;モデルの特定の層を演算器(GPUなど)の特性に合わせて再構成する技術を何というか。

複数の演算を1つにまとめてメモリアクセスを減らす。