HOMELv014 エキスパート(人間など)の行動ログから;その背後にある「報酬関数」を推定して学習する手法はどれか。 2026年1月25日 報酬設計が困難なタスクにおいて有効なアプローチ。 ピクセル単位の分類(セグメンテーション)において;「境界線」をより精緻に抽出するために用いられる構造はどれか。 高次元データの情報を保ちつつ低次元に圧縮する非線形の手法で;可視化によく用いられるのはどれか。