HOME
Lv040

「Lv040」の記事一覧

「RLHF (Reinforcement Learning from Human Feedback)」のプロセスの順序として正しいものはどれか。

まず人間が書いた回答でモデルを微調整(SFT)し、次に人間の評価データで報酬モデルを作り、最後にその報酬…

2026年3月13日

「Conformal Prediction（適合予測）」が提供するものは何か。

点推定ではなく、「この範囲に真値が95%の確率で入る」といった統計的な保証付きの予測領域を出力する枠組…

2026年3月13日

「SimSiam」などの自己教師あり学習における「Collapsing（崩壊）」とはどのような現象か。

負例（Negative Pairs）を使わない手法において、モデルが「常に同じ出力をすれば損失が0になる」という自…

2026年3月13日

「拡散モデル（Diffusion Model）」において、サンプリングを高速化する手法（例：DDIM）のアプローチはどれか。

DDPMは確率的な逆拡散過程を経るためステップ数が多いが、DDIMは非マルコフ過程を仮定し、同じ学習済みモ…

2026年3月13日

「Vision-Language Model (VLM)」における「Flamingo」のようなモデルの特徴はどれか。

既存の高性能な言語モデルと画像モデルの重みを固定したまま、それらをつなぐアダプタ部分のみを学習させ…

2026年3月13日

LLMのファインチューニング手法「LoRA (Low-Rank Adaptation)」の仕組みはどれか。

巨大なモデルの全パラメータを再学習するのはコストが高いため、更新量を行列分解した少数のパラメータに…

2026年3月13日

「NeRF」を高速化するために開発された「Instant NGP」などで使われる技術はどれか。

空間座標をハッシュテーブルを用いた特徴ベクトルにマッピングすることで、NeRFの学習と推論を劇的（数秒…

2026年3月13日

グラフニューラルネットワークの「GraphSAGE」の特徴はどれか。

固定されたグラフ上のノードだけでなく、学習済みの集約関数を使うことで、新たに追加されたノードや別の…

2026年3月13日

メタ学習手法「MAML (Model-Agnostic Meta-Learning)」の核心的なアイデアはどれか。

「学習の仕方を学習する」アプローチの一つで、どんなタスクが来ても、わずかなステップで最適解に到達で…

2026年3月13日

強化学習手法「SAC (Soft Actor-Critic)」の特徴はどれか。

エントロピー正則化項を入れることで、探索（Exploration）を促進し、局所解への陥没を防ぎつつロバストな…

2026年3月13日