「ドキュメントをデジタル化」の結果(DOM)において、文字化け(など)が発生している場合、抽出フェーズで最も有効な対策は。

DOM生成時点での文字化けは、後続の抽出精度に致命的な影響を与えるため、根本原因であるOCRエンジンの設定見直しや種類変更が最優先である。