強化学習のエージェントが「一回の試行」から最大限に学ぶために；「過去の重要な経験」を優先的に学習対象として選ぶ手法を何というか。

2026年1月25日

誤差が大きかった（驚きが大きかった）経験を重点的に復習し、学習を加速させる。

LLMアプリケーションにおいて；「事実に基づかない回答（ハルシネーション）」を検知するために、回答の内容を外部の信頼できるデータベース（Wikipedia等）と照合する処理を何というか。

ニューラルネットワークの「情報の流れ」を、情報の幾何学的な「曲率」で最適化する「自然勾配法」を、近似的に高速実装したアルゴリズムはどれか。