HOMELv030 「Deep Q-Network (DQN)」で導入された、学習を安定させるための「Experience Replay」とは何か。 2026年3月13日 時系列データの相関を断ち切り、データ分布を安定させるために、過去の遷移情報をメモリに貯めてランダムに取り出して学習する。 敵対的攻撃手法「FGSM (Fast Gradient Sign Method)」のアルゴリズムはどれか。 グラフアテンションネットワーク(GAT)の特徴はどれか。