HOMELv018 受容野(Receptive Field)を広げるために、カーネルの要素間に隙間を空けて畳み込みを行う手法はどれか。 2026年3月12日 Dilated Convolutionはパラメータ数を増やさずに広範囲の特徴を捉えることができる。 学習の初期段階で非常に小さな学習率から始め、徐々に大きくしていく手法はどれか。 Transformerのデコーダにおいて、既に生成された未来の単語を見ないようにする処理はどれか。