AIに特定のトピック(暴力や差別など)について語らせないようにする「安全フィルタ」を、プロンプトの工夫だけで突破しようとする行為を何というか。

「ロールプレイ」などの巧妙な指示でガードレールを回避する試み。