LLMアプリケーションにおいて；出力された回答が「特定の倫理ガイドライン」に違反していないかを、リアルタイムで別のLLMがスコアリングする仕組みを何というか。

2026年1月25日

安全性を数値化し；一定の基準を超えた場合にのみ出力を許可する。

AIが「特定の個人の声」を学習し、その人が言っていない「政治的メッセージ」を発信させるディープフェイクが引き起こす、民主主義への脅威を何というか。

強化学習において；エージェントが「直接的な報酬（エサ）」だけでなく；「将来的に有利な状態（安全な場所など）」を学習するために、状態そのものに価値をつける関数はどれか。