モデルの精度を評価する際;「予測された確率」が「実際の正解率」とどの程度一致しているか(例:0.7と予測したら7割の確率で正解するか)を評価することを何というか。

AIが「自分の自信」をどれだけ正確に把握できているかを測る、信頼性の重要指標。