AIの出力が人間の価値観に合致するように;あらかじめ定義された「AIのための憲法(規則群)」を用いて自己修正させる手法はどれか。

Anthropicが提唱した;人間の評価に依存しすぎないアライメント手法。