強化学習において；エージェントが「環境の状態」を遷移確率として完全にモデル化し；頭の中で「想像学習」を行う手法を何というか。

2026年1月25日

実環境での試行錯誤を減らし；シミュレーション内で効率的に学習を進める枠組み。

LLMの運用において；特定の「不適切な画像や文章」が生成されないように；生成プロセスの中間段階で特徴量を監視し中断する機能を何というか。

ニューラルネットワークの「情報の伝播」において；入力の微小な変化が出力に大きな変化を及ぼす「カオス性」を抑制するための初期化理論はどれか。