HOMELv015 TransformerのSelf-Attentionにおいて、各単語から生成される3つのベクトルはどれか。 2026年4月3日 Q, K, Vの3つを用いて各単語の関連度を計算する。 ベルヌーイ試行を n 回行ったときに、成功する回数 k が従う分布はどれか。 最適化アルゴリズムにおいて、Adamが内部で保持している「1次のモーメント」は何に対応するか。