LLMの運用において；特定の「不適切な画像や文章」が生成されるのを防ぐために、生成プロセスの中間段階で特徴量を監視し、問題があれば中断するセキュリティ機能を何というか。

2026年1月25日

出力が出る「直前」に介入し、安全性をリアルタイムで担保する防御策。

AIが「特定の政治的・社会的な信条」を勝手に学習し、その信条に基づいてユーザーを差別したり排除したりすることを防ぐために、あらかじめ定義された「倫理原則」を強制的にモデルに組み込むプロセスはどれか。

強化学習において；エージェントが「1つのタスク」を学ぶ際、あえて「関連する別のタスク」も同時に学習させることで、表現力を高めて汎化性能を向上させる手法を何というか。