AIに「人を傷つける方法」を教えないように；倫理的なガイドラインを学習させるプロセスを何というか。

2026年1月25日

モデルの挙動を人間の価値観に一致させること。

AIの導入効果を測定する際；「AI導入によって削減された時間」を人件費に換算して評価する指標を何というか。

報酬が「成功(1)」か「失敗(0)」しかなく；途中のプロセスが評価されない過酷な報酬環境を何と呼ぶか。