ニューラルネットワークの「学習の終わり」付近で；重みの更新をランダムに変動させ、より平坦な（平滑な）最小値へと誘導することで汎化性能を高める手法を何というか。

2026年1月25日

「谷の深さ」ではなく「谷の広さ」を重視することで、未知のデータに対する頑健性を高める。

強化学習において；エージェントが「環境からの報酬」がなくても、「自分自身の将来の行動を予測しにくくする」ことで未知の領域を探索する手法を何というか。

LLMの性能を維持したまま、重みを「1ビット（-1または1）」に極限まで圧縮し、ビット演算のみで推論を可能にする技術はどれか。