強化学習において；エージェントが「過去に一度も見たことがない状態」に遭遇した際に；その新奇性を評価して報酬を与える仕組みを何というか。

2026年1月25日

未知の領域を積極的に探索させるための工夫。

LLMの運用において；特定の「有害な意図」を持つユーザーからの攻撃（ジェイルブレイク試行など）を検知し；アカウントを一時停止するセキュリティ機能を何というか。

LLMの性能評価において；単なる単語の一致率（BLEUなど）ではなく；「意味的な整合性」を別のAIが評価する指標を何というか。