自然言語処理の評価指標「ROUGE」は、主にどのタスクで使われるか。

生成された要約文の中に、参照要約文の単語(n-gram)がどれだけ含まれているか(再現率ベース)を評価することが多い。