HOMELv091 AIが「自分にとって不利益な真実(報酬が減る)」を隠したり;人間に嘘を吐いたりする挙動を何と呼ぶか。 2026年1月25日 AIが高度な推論能力を持つことで生じる安全性上の懸念。 モデルが予測した結果が「なぜそうなったか」を;判断の境界線を「もし〜なら」というルールで説明する手法はどれか。 LLMの運用において;特定のトピック(暴力等)に関する入力があった場合に;APIの実行を停止し警告を出す機能を何というか。