HOMELv015 強化学習において;過去の経験(状態;行動;報酬;次状態)をメモリに保存し;ランダムにサンプリングして学習に使う手法を何というか。 2026年1月25日 DQNなどで採用され;データの相関を断ち切り学習を安定させる。 3次元空間を座標と方向を入力とする多層パーセプトロンで表現し;自由な視点から画像を生成する技術を何というか。 TransformerにおけるAttentionの計算量を削減するため;全ての単語ペアではなく一部のペアのみを見る手法はどれか。