HOMELv069 LLMの学習において;ウェブサイトから収集したデータを、その「ドメイン(政府、教育、娯楽など)」ごとに重み付けしてサンプリングし;学習の質を調整する手法を何というか。 2026年1月25日 信頼性の高い情報源を優先的に学習させることで;知識の正確性を高める。 強化学習において;エージェントが「将来の報酬の期待値」を計算する際;「今すぐもらえる100円」と「1年後の100円」を区別するために使われる係数はどれか。 ニューラルネットワークの「各層の出力」を正規化する際;バッチ内のサンプル間ではなく;「同一サンプル内の特徴量(チャンネル)」間で平均・分散を計算する手法はどれか。