エージェントが「何をすべきか」という目標(Goal)自体を動的に生成し、自己学習を繰り返す強化学習の枠組みを何というか。

外部からの報酬がなくても、好奇心や新奇性に基づいて自律的にスキルを獲得する。