HOMELv007 単語の並びの確率分布を学習し;次に来る単語を予測するモデルを一般に何と呼ぶか。 2026年1月25日 GPTなどの大規模言語モデル(LLM)の根本的な仕組みである。 ある事象Aが起こったという条件のもとで;事象Bが起こる確率を何というか。 多クラス分類の出力層において;各ノードの出力の総和が1になるように変換する関数はどれか。