標準のSpark MLlib `Imputer` は主に数値列(Double/Float)の平均値・中央値・最頻値補完を対象としており、文字列カテゴリ変数の補完にはカスタムロジックや他の手段が必要な場合が多い(注:最新バージョンでの拡張に注意が必要だが、基本は数値対象)。
標準のSpark MLlib `Imputer` は主に数値列(Double/Float)の平均値・中央値・最頻値補完を対象としており、文字列カテゴリ変数の補完にはカスタムロジックや他の手段が必要な場合が多い(注:最新バージョンでの拡張に注意が必要だが、基本は数値対象)。