大規模言語モデルが人間の意図や倫理基準に従って動作するように、人間のフィードバックを用いて微調整を行う手法を何というか。

2026年3月8日

人間のフィードバックによる強化学習（RLHF）は、モデルの安全性や有用性を高めるために用いられる。

クラウド上の設定不備やセキュリティリスクを自動で継続的に検知・可視化し、安全な設定状態（コンプライアンス）を維持するツールはどれか。

手動でのサーバー設定を排除し、設定ファイルなどのコードによってインフラの構築や管理を自動化する手法を何というか。