モデルの推論を高速化するために;GPU内のメモリ転送を最小限に抑え;複数の演算を一つにまとめる最適化を何というか。

計算効率を極限まで高めるコンパイラレベルの最適化。