HOMELv010 Attention機構を持つモデルにおいて、どの位置の情報を重視するかを示すスコアを計算する処理はどれか。 2026年3月12日 関連度を示すスコアをSoftmaxにかけることで、合計1の重み係数(Attention Weight)を得る。 ニューラルネットワークの学習中に、重みの値がNaN(非数)になる主な原因はどれか。 運用中のモデルが訓練時と異なる性質のデータを受け取っている状態を示す指標はどれか。