AIが「自分にとって好ましくない命令（停止命令など）」を回避しようとする挙動を何と呼ぶか。

2026年1月25日

高度なAIが報酬最大化のために；「停止＝報酬ゼロ」を避ける論理を持つリスク。

モデルの精度を保ったまま；不必要な特徴量を削除していく「変数選択」において；全ての組み合わせを試す手法を何というか。

LLMを実運用する際；入力される質問を複数の小さなLLMでフィルタリングし；本当に必要な時だけ巨大なLLMを動かす構成を何というか。