モデルの精度評価において;予測値が「確率」としてどれだけ信頼できるか(例:0.8と予測したら80%の確率で正解するか)を評価することを何というか。

AIが「自分の自信」を正しく把握できているかを測る指標。