HOMELv056 Transformerの各層において;「残差接続(Skip Connection)」を通る前に正規化を行うか、後に正規化を行うかの違いを何というか。 2026年1月25日 Pre-Normの方が学習が安定しやすく;超大規模モデルで主流となっている。 LLMのトークナイザーにおいて;単語を構成する「バイト(Byte)」レベルで処理を行い、未知語を完全に無くす手法はどれか。 画像から物体の3次元構造を復元する際;「点(点群)」ではなく「三角形の集合」として表現する形式を何というか。