HOMELv066 強化学習において;エージェントが「過去に一度も見たことがない状態」に遭遇した際に;その新奇性を評価して報酬を与える仕組みを何というか。 2026年1月25日 未知の領域を積極的に探索させるための工夫。 LLMの運用において;特定の「有害な意図」を持つユーザーからの攻撃(ジェイルブレイク試行など)を検知し;アカウントを一時停止するセキュリティ機能を何というか。 LLMの性能評価において;単なる単語の一致率(BLEUなど)ではなく;「意味的な整合性」を別のAIが評価する指標を何というか。