HOMELv100 ニューラルネットワークの「情報の伝播」を幾何学的に解析し;情報の対称性を保ったまま学習させる「等変ニューラルネットワーク」の利点はどれか。 2026年1月25日 データの持つ幾何学的な対称性(回転等)を利用し効率的に学習できる。 強化学習において;「環境から得られる報酬」をそのまま使うのではなく;「人間から見た行動の良さ」を反映した報酬に変換するプロセスを何というか。 LLMの性能を極限まで高めるために;「解答の正しさ」を自己検証し;思考の道筋(ステップ)を何度も修正しながら答えを導き出す推論手法はどれか。