素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv028
「Lv028」の記事一覧
全結合層(Affine層)の順伝播計算式はどれか(W:重み, x:入力, b:バイアス)。
入力ベクトルに行列を掛けて線形変換し、バイアスベクトルを足すのが全結合層の基本操作である。
2026年3月13日
LSTMにおいて、新しい情報をセル状態に追加するかどうかを決めるゲートはどれか。
tanh層で作成された新しい候補値を、どれだけセル状態に加えるかを0〜1の範囲で調整するのが入力ゲートの…
2026年3月13日
Word2Vecの「CBOW」モデルの予測タスクはどれか。
Continuous Bag-of-Wordsは、穴埋め問題のように、周りの単語情報(コンテキスト)を合計して真ん中の単語…
2026年3月13日
CNNにおいて「ストライド(Stride)」を1から2に増やすとどうなるか。
フィルタを適用する間隔を広げることになるため、出力される画像の解像度(縦横サイズ)は小さくなる。
2026年3月13日
Max Pooling層の誤差逆伝播において、勾配はどのように伝わるか。
順伝播で選ばれなかった(最大値でなかった)要素は出力に寄与していないため、微分値(勾配)は0となる。
2026年3月13日
シグモイド関数を多層ネットワークの隠れ層で使うと起きやすい問題はどれか。
シグモイド関数の微分最大値は0.25であり、層を経るごとに勾配が1/4以下に減衰していくため、入力層付近で…
2026年3月13日
Batch Normalizationが推論時(テスト時)に使用する平均と分散はどれか。
推論時はデータが1つずつ来ることもあるため、バッチ統計量は使えず、学習中に蓄積した移動平均などの固定…
2026年3月13日
最適化手法「Momentum SGD」の更新式に含まれる項はどれか。
前回の重み更新量(速度)に摩擦係数(慣性係数)を掛けたものを加算することで、振動を抑えつつ加速する。
2026年3月13日
ドロップアウト率0.5の意味はどれか。
各更新ステップにおいて、隠れ層のニューロンの半数がランダムに選ばれ、出力が0になる。
2026年3月13日
活性化関数Leaky ReLUの数式定義(x < 0 のとき)はどれか(aは小さな正の定数)。
xが負の領域で勾配が完全に0になるのを防ぐため、わずかな傾きaを持たせるのがLeaky ReLUである。
2026年3月13日
投稿のページ送り
1
…
95
96
97
…
275