多クラス分類の評価において、各クラスのF1スコアを計算し、クラスごとのサンプル数に関わらず単純平均をとる手法はどれか。

Macro Averageは、サンプル数が少ないクラスの影響度も等しく扱うため、全体のバランスを評価するのに適しています。