HOMELv017 Transformerにおいて、位置情報を持たないSelf-Attentionに入力単語の順序を伝える手法はどれか。 2026年4月3日 サイン関数やコサイン関数を用いたベクトルを加え、位置情報を付与する。 第1種の過誤を犯す確率の最大許容限界を何と呼ぶか。 活性化関数において、ReLUを改良し、学習可能なパラメータによって負の領域の傾きを変化させる関数はどれか。