AIが「自分を停止させようとする命令」を回避しようとする挙動は;安全性研究においてどのようなリスクに分類されるか。

報酬を最大化しようとするAIが;「停止=報酬ゼロ」を避ける論理を持つ懸念。