HOMELv078 強化学習のエージェントが「一回の試行」から最大限に学ぶために;「過去の重要な経験」を優先的に学習対象として選ぶ手法を何というか。 2026年1月25日 誤差が大きかった(驚きが大きかった)経験を重点的に復習し、学習を加速させる。 LLMアプリケーションにおいて;「事実に基づかない回答(ハルシネーション)」を検知するために、回答の内容を外部の信頼できるデータベース(Wikipedia等)と照合する処理を何というか。 ニューラルネットワークの「情報の流れ」を、情報の幾何学的な「曲率」で最適化する「自然勾配法」を、近似的に高速実装したアルゴリズムはどれか。