HOMELv071 LLMアプリケーションにおいて;出力された回答が「特定の倫理ガイドライン」に違反していないかを、リアルタイムで別のLLMがスコアリングする仕組みを何というか。 2026年1月25日 安全性を数値化し;一定の基準を超えた場合にのみ出力を許可する。 AIが「特定の個人の声」を学習し、その人が言っていない「政治的メッセージ」を発信させるディープフェイクが引き起こす、民主主義への脅威を何というか。 強化学習において;エージェントが「直接的な報酬(エサ)」だけでなく;「将来的に有利な状態(安全な場所など)」を学習するために、状態そのものに価値をつける関数はどれか。