HOMELv034 モデルの推論を高速化するために;GPU内のメモリ転送を最小限に抑え;複数の演算を一つにまとめる最適化を何というか。 2026年1月25日 計算効率を極限まで高めるコンパイラレベルの最適化。 AIの学習に使われるデータセット自体に;社会的な偏見が混じっていないかを測定する指標の総称を何というか。 LLMの推論を高速化するために;小さなモデルで下書きを作成し大きなモデルで検証する手法はどれか。