HOMELv032 AIに「人を傷つける方法」を教えないように;倫理的なガイドラインを学習させるプロセスを何というか。 2026年1月25日 モデルの挙動を人間の価値観に一致させること。 AIの導入効果を測定する際;「AI導入によって削減された時間」を人件費に換算して評価する指標を何というか。 報酬が「成功(1)」か「失敗(0)」しかなく;途中のプロセスが評価されない過酷な報酬環境を何と呼ぶか。