AIに特定の質問をしても回答を拒否させるなど;安全なガードレールを設置する訓練手法を何というか。

意図的に攻撃的な入力を与えて弱点を見つけ;修正する。