HOMELv024 活性化関数を適用する前にバッチ正規化を配置する場合と、後に配置する場合の議論において、原論文(v1)が推奨した位置はどちらか。 2026年4月3日 非線形変換の入力分布を整えるため、ReLU等の前に置くことが提案された。 LLMのコンテキストウィンドウを拡大するために、長い系列に対してアテンションをスライドさせる手法はどれか。 SVMにおける「スラック変数」が導入される目的はどれか。