文章全体を一度に処理でき;文中の離れた単語間の関係性を効率よく学習できるメカニズムはどれか。

Transformerの核心技術であり;並列処理を可能にした。