HOMELv080 ニューラルネットワークの「学習の終わり」付近で;重みの更新をランダムに変動させ、より平坦な(平滑な)最小値へと誘導することで汎化性能を高める手法を何というか。 2026年1月25日 「谷の深さ」ではなく「谷の広さ」を重視することで、未知のデータに対する頑健性を高める。 強化学習において;エージェントが「環境からの報酬」がなくても、「自分自身の将来の行動を予測しにくくする」ことで未知の領域を探索する手法を何というか。 LLMの性能を維持したまま、重みを「1ビット(-1または1)」に極限まで圧縮し、ビット演算のみで推論を可能にする技術はどれか。