HOMELv047 AIが「自分にとって好ましくない命令(停止命令など)」を回避しようとする挙動を何と呼ぶか。 2026年1月25日 高度なAIが報酬最大化のために;「停止=報酬ゼロ」を避ける論理を持つリスク。 モデルの精度を保ったまま;不必要な特徴量を削除していく「変数選択」において;全ての組み合わせを試す手法を何というか。 LLMを実運用する際;入力される質問を複数の小さなLLMでフィルタリングし;本当に必要な時だけ巨大なLLMを動かす構成を何というか。