HOMELv010 人間がフィードバックを与えて、生成AIの回答を好ましい方向に調整する手法はどれか。 2026年3月13日 人間の評価を報酬として強化学習を行い、AIの振る舞いを人間に最適化する。 質的変数のカテゴリー間の関連性の強さを分析する統計手法はどれか。 エッジデバイスで動作させるために、AIモデルのサイズを軽量化する技術はどれか。