「Deep Q-Network (DQN)」で導入された、学習を安定させるための「Experience Replay」とは何か。

2026年3月13日

時系列データの相関を断ち切り、データ分布を安定させるために、過去の遷移情報をメモリに貯めてランダムに取り出して学習する。

敵対的攻撃手法「FGSM (Fast Gradient Sign Method)」のアルゴリズムはどれか。

グラフアテンションネットワーク（GAT）の特徴はどれか。