「抽出器トレーナー」を使用する際、検証済みのデータだけでなく、検証なし(信頼度が高い)データも学習に使うべきか。

基本的には「人間が正解を確認したデータ(検証済み)」のみを学習データとして蓄積すべきであり、未確認データを含めるとノイズを学習する危険がある。