強化学習において；過去の経験（状態；行動；報酬；次状態）をメモリに保存し；ランダムにサンプリングして学習に使う手法を何というか。

2026年1月25日

DQNなどで採用され；データの相関を断ち切り学習を安定させる。

3次元空間を座標と方向を入力とする多層パーセプトロンで表現し；自由な視点から画像を生成する技術を何というか。

TransformerにおけるAttentionの計算量を削減するため；全ての単語ペアではなく一部のペアのみを見る手法はどれか。