HOMELv082 ニューラルネットワークの「重みの更新」に勾配(一次微分)だけでなく、情報の幾何学的な「メトリック」である「フィッシャー情報行列」を用いる最適化手法はどれか。 2026年1月25日 勾配の更新を「ユークリッド空間」ではなく「確率分布の空間」で行うことで収束を早める。 強化学習において;エージェントが「環境からの報酬」が全く得られない間も、「世界がどう変化するか」という予測誤差を「驚き」として報酬にする手法はどれか。 LLMに「複数の異なる役割」を同時に演じさせ、それらに同じ問題を解かせた上で、最後にそれらの回答を統合・要約させる手法を何というか。