HOMELv099 LLMの学習において;「数学の問題」や「コードの解説」など;論理的思考が必要な高品質データをAI自身に生成させて学習させる手法はどれか。 2026年1月25日 インターネット上のデータの質の限界を克服し;推論能力を飛躍的に高める。 強化学習において;エージェントが「環境からの報酬」が全くない状態で;「世界がどう変化するか」の地図だけを先に作る段階を何というか。 ニューラルネットワークの学習において;「局所最適解」に陥るのを防ぐため;学習率を周期的に上下させる手法を何というか。