人間がフィードバックを与えて、生成AIの回答を好ましい方向に調整する手法はどれか。

2026年3月13日

人間の評価を報酬として強化学習を行い、AIの振る舞いを人間に最適化する。

質的変数のカテゴリー間の関連性の強さを分析する統計手法はどれか。

エッジデバイスで動作させるために、AIモデルのサイズを軽量化する技術はどれか。