LLMに「内緒で考えて（思考用トークンを出力させずに）」推論を行わせることで；論理的整合性を高める最新の手法はどれか。

2026年1月25日

思考プロセスを明示的に踏むことで；複雑な推論問題の正解率を向上させる。

報酬が一切得られない状態でも；エージェントが「環境についての知識」を増やすこと自体を目的として学習する手法を何というか。

ニューラルネットワークの学習において；勾配計算を簡略化し；各層の更新を独立して並列に行う手法の総称はどれか。