HOMELv006 多クラス分類の出力層で、各クラスの確率の合計を1にするために使用される関数はどれか。 2026年3月12日 Softmax関数は出力を確率分布として解釈可能な形式に変換する。 静的な計算グラフを構築してから実行する「Define-and-Run」方式の代表例はどれか。 BERTのように、文脈を考慮した双方向の単語表現を獲得するモデルが採用している学習手法はどれか。