Transformerのデコーダにおいて、既に生成された未来の単語を見ないようにする処理はどれか。

2026年3月12日

Maskingにより、推論時と同様に過去の情報のみに基づいて次の単語を予測させる。

受容野（Receptive Field）を広げるために、カーネルの要素間に隙間を空けて畳み込みを行う手法はどれか。

Watson Assistantのダイアログにおいて、ユーザーの特定の情報（名前や日付など）を保持する変数はどれか。