AIが「自分を停止させようとする命令」を回避しようとする挙動は；安全性研究においてどのようなリスクに分類されるか。

2026年1月25日

報酬を最大化しようとするAIが；「停止＝報酬ゼロ」を避ける論理を持つ懸念。

不均衡データの学習において；「少ない方のクラス」のデータを周辺データとの合成によって人工的に作り出すアルゴリズムはどれか。

LLMアプリケーションにおいて；「事実に基づかない回答（ハルシネーション）」を最小化するために；外部の信頼できるデータベースと照合する処理を何というか。