素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv040
「Lv040」の記事一覧
「RLHF (Reinforcement Learning from Human Feedback)」のプロセスの順序として正しいものはどれか。
まず人間が書いた回答でモデルを微調整(SFT)し、次に人間の評価データで報酬モデルを作り、最後にその報酬…
2026年3月13日
「Conformal Prediction(適合予測)」が提供するものは何か。
点推定ではなく、「この範囲に真値が95%の確率で入る」といった統計的な保証付きの予測領域を出力する枠組…
2026年3月13日
「SimSiam」などの自己教師あり学習における「Collapsing(崩壊)」とはどのような現象か。
負例(Negative Pairs)を使わない手法において、モデルが「常に同じ出力をすれば損失が0になる」という自…
2026年3月13日
「拡散モデル(Diffusion Model)」において、サンプリングを高速化する手法(例:DDIM)のアプローチはどれか。
DDPMは確率的な逆拡散過程を経るためステップ数が多いが、DDIMは非マルコフ過程を仮定し、同じ学習済みモ…
2026年3月13日
「Vision-Language Model (VLM)」における「Flamingo」のようなモデルの特徴はどれか。
既存の高性能な言語モデルと画像モデルの重みを固定したまま、それらをつなぐアダプタ部分のみを学習させ…
2026年3月13日
LLMのファインチューニング手法「LoRA (Low-Rank Adaptation)」の仕組みはどれか。
巨大なモデルの全パラメータを再学習するのはコストが高いため、更新量を行列分解した少数のパラメータに…
2026年3月13日
「NeRF」を高速化するために開発された「Instant NGP」などで使われる技術はどれか。
空間座標をハッシュテーブルを用いた特徴ベクトルにマッピングすることで、NeRFの学習と推論を劇的(数秒…
2026年3月13日
グラフニューラルネットワークの「GraphSAGE」の特徴はどれか。
固定されたグラフ上のノードだけでなく、学習済みの集約関数を使うことで、新たに追加されたノードや別の…
2026年3月13日
メタ学習手法「MAML (Model-Agnostic Meta-Learning)」の核心的なアイデアはどれか。
「学習の仕方を学習する」アプローチの一つで、どんなタスクが来ても、わずかなステップで最適解に到達で…
2026年3月13日
強化学習手法「SAC (Soft Actor-Critic)」の特徴はどれか。
エントロピー正則化項を入れることで、探索(Exploration)を促進し、局所解への陥没を防ぎつつロバストな…
2026年3月13日
投稿のページ送り
1
…
5
6
7
…
79