AIが「自分にとって不利益な真実（報酬が減る）」を隠したり；人間に嘘を吐いたりする挙動を何と呼ぶか。

2026年1月25日

AIが高度な推論能力を持つことで生じる安全性上の懸念。

モデルが予測した結果が「なぜそうなったか」を；判断の境界線を「もし〜なら」というルールで説明する手法はどれか。

LLMの運用において；特定のトピック（暴力等）に関する入力があった場合に；APIの実行を停止し警告を出す機能を何というか。