素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv030
「Lv030」の記事一覧
Neural Architecture Search (NAS) の大きな課題の一つは何か。
無数のアーキテクチャ候補を学習・評価する必要があるため、強化学習や進化的アルゴリズムを使うと数百〜…
2026年3月13日
「Deep Q-Network (DQN)」で導入された、学習を安定させるための「Experience Replay」とは何か。
時系列データの相関を断ち切り、データ分布を安定させるために、過去の遷移情報をメモリに貯めてランダム…
2026年3月13日
グラフアテンションネットワーク(GAT)の特徴はどれか。
GCNのように固定的な重み(次数行列など)ではなく、ノード間の特徴の関係性に基づいて適応的に重み付けを…
2026年3月13日
知識蒸留において、教師モデルが出力する確率分布(ソフトターゲット)を使う利点はどれか。
単なる正解ラベル(ハードターゲット)よりも、「犬は猫に似ているが車には似ていない」といった詳細な知…
2026年3月13日
敵対的攻撃手法「FGSM (Fast Gradient Sign Method)」のアルゴリズムはどれか。
モデルが誤分類する方向(損失が増える方向)へ、勾配の符号(サイン)を使った微小なノイズを一回のステ…
2026年3月13日
Few-shot Learningにおける「N-way K-shot」の意味はどれか。
サポートセット(例示データ)の構成を表す用語で、クラス数Nとサンプル数Kによってタスクの難易度が決ま…
2026年3月13日
「方策勾配定理(Policy Gradient Theorem)」が示す内容はどれか。
報酬は環境に依存し微分不可能に見えるが、対数微分法を用いることで、期待報酬の勾配を方策関数の勾配を…
2026年3月13日
グラフニューラルネットワーク(GNN)において、グラフ構造を表す行列はどれか。
ノード間の結合関係(エッジの有無)を0と1などで表現した正方行列で、GNNの演算において近傍情報を集約す…
2026年3月13日
強化学習における割引率(Discount Factor)γの役割はどれか。
0〜1の値をとり、未来の報酬ほど割り引いて評価することで、直近の報酬を重視するか長期的利益を重視する…
2026年3月13日
Q学習が「オフポリシー(Off-policy)」であるとされる理由はどれか。
探索のためにランダムに動く挙動(Behavior Policy)とは別に、常に最適な行動をとると仮定してQ値を更新…
2026年3月13日
投稿のページ送り
1
…
91
92
93
…
271