BERTモデルのアーキテクチャの基礎となっているのは、Transformerのどの部分か。

2026年3月11日

BERT（Bidirectional Encoder Representations from Transformers）は、TransformerのEncoder部分を積層して双方向の文脈を学習するモデルである。

MindSporeのデータセット処理において、複数のデータをまとめてミニバッチを作成するメソッドはどれか。

Ascend AIプロセッサの論理アーキテクチャにおいて、命令のデコードやタスクのディスパッチ（割り当て）を行うユニットはどれか。