HOME
Lv030

「Lv030」の記事一覧

Neural Architecture Search (NAS) の大きな課題の一つは何か。

無数のアーキテクチャ候補を学習・評価する必要があるため、強化学習や進化的アルゴリズムを使うと数百〜…

2026年3月13日

「Deep Q-Network (DQN)」で導入された、学習を安定させるための「Experience Replay」とは何か。

時系列データの相関を断ち切り、データ分布を安定させるために、過去の遷移情報をメモリに貯めてランダム…

2026年3月13日

グラフアテンションネットワーク（GAT）の特徴はどれか。

GCNのように固定的な重み（次数行列など）ではなく、ノード間の特徴の関係性に基づいて適応的に重み付けを…

2026年3月13日

知識蒸留において、教師モデルが出力する確率分布（ソフトターゲット）を使う利点はどれか。

単なる正解ラベル（ハードターゲット）よりも、「犬は猫に似ているが車には似ていない」といった詳細な知…

2026年3月13日

敵対的攻撃手法「FGSM (Fast Gradient Sign Method)」のアルゴリズムはどれか。

モデルが誤分類する方向（損失が増える方向）へ、勾配の符号（サイン）を使った微小なノイズを一回のステ…

2026年3月13日

Few-shot Learningにおける「N-way K-shot」の意味はどれか。

サポートセット（例示データ）の構成を表す用語で、クラス数Nとサンプル数Kによってタスクの難易度が決ま…

2026年3月13日

「方策勾配定理（Policy Gradient Theorem）」が示す内容はどれか。

報酬は環境に依存し微分不可能に見えるが、対数微分法を用いることで、期待報酬の勾配を方策関数の勾配を…

2026年3月13日

グラフニューラルネットワーク（GNN）において、グラフ構造を表す行列はどれか。

ノード間の結合関係（エッジの有無）を0と1などで表現した正方行列で、GNNの演算において近傍情報を集約す…

2026年3月13日

強化学習における割引率（Discount Factor）γの役割はどれか。

0〜1の値をとり、未来の報酬ほど割り引いて評価することで、直近の報酬を重視するか長期的利益を重視する…

2026年3月13日

Q学習が「オフポリシー（Off-policy）」であるとされる理由はどれか。

探索のためにランダムに動く挙動（Behavior Policy）とは別に、常に最適な行動をとると仮定してQ値を更新…

2026年3月13日