ニューラルネットワークの「重みの更新」に勾配（一次微分）だけでなく、情報の幾何学的な「メトリック」である「フィッシャー情報行列」を用いる最適化手法はどれか。

2026年1月25日

勾配の更新を「ユークリッド空間」ではなく「確率分布の空間」で行うことで収束を早める。

強化学習において；エージェントが「環境からの報酬」が全く得られない間も、「世界がどう変化するか」という予測誤差を「驚き」として報酬にする手法はどれか。

LLMに「複数の異なる役割」を同時に演じさせ、それらに同じ問題を解かせた上で、最後にそれらの回答を統合・要約させる手法を何というか。