期待される収益だけでなく；そのリスク（分布）も考慮して学習を行う強化学習の分野はどれか。

2026年1月25日

平均値だけでなく報酬のばらつきをモデル化する。

TransformerのAttention機構において；Query, Key, Valueの重みを複数の「ヘッド」に分ける手法はどれか。

画像生成AIにおいて；画像とテキストの対応関係を学習するために使用される大規模なデータセットの代表例はどれか。