HOMELv047 LLMに「内緒で考えて(思考用トークンを出力させずに)」推論を行わせることで;論理的整合性を高める最新の手法はどれか。 2026年1月25日 思考プロセスを明示的に踏むことで;複雑な推論問題の正解率を向上させる。 報酬が一切得られない状態でも;エージェントが「環境についての知識」を増やすこと自体を目的として学習する手法を何というか。 ニューラルネットワークの学習において;勾配計算を簡略化し;各層の更新を独立して並列に行う手法の総称はどれか。