「AIガバナンス」の議論において;AIが「人間に嘘をつく(Deception)」ことを防ぐために、モデルの「思考(隠れ状態)」を監視する手法を何というか。

出力を変えずに、内部で「騙そうとしているか」を検知しようとする試み。