エキスパート（人間など）の行動ログから；その背後にある「報酬関数」を推定して学習する手法はどれか。

2026年1月25日

報酬設計が困難なタスクにおいて有効なアプローチ。

ピクセル単位の分類（セグメンテーション）において；「境界線」をより精緻に抽出するために用いられる構造はどれか。

高次元データの情報を保ちつつ低次元に圧縮する非線形の手法で；可視化によく用いられるのはどれか。