HOMELv095 LLMアプリケーションにおいて;「事実に基づかない回答(ハルシネーション)」を最小化するために;外部の信頼できるデータベースと照合する処理を何というか。 2026年1月25日 生成された回答を現実の事実と結びつけ;信頼性を担保する。 AIが「自分を停止させようとする命令」を回避しようとする挙動は;安全性研究においてどのようなリスクに分類されるか。 強化学習において;「将来の報酬の期待値」だけでなく;その報酬の「ばらつき(分布)」自体を学習する手法を何というか。