Attentionメカニズムにおける「Attention Map(重み)」が表しているものは何か。

入力シーケンスの各要素に対する重要度(0〜1)の分布であり、モデルの判断根拠を可視化する際にも使われる。