欠損値を含むデータセットに対して `Imputer` を使用する際、数値列だけでなくカテゴリ列（文字列）の欠損値を最頻値で補完したい。Spark MLlibのImputerはこれをサポートしているか。

2026年3月8日

標準のSpark MLlib `Imputer` は主に数値列（Double/Float）の平均値・中央値・最頻値補完を対象としており、文字列カテゴリ変数の補完にはカスタムロジックや他の手段が必要な場合が多い（注：最新バージョンでの拡張に注意が必要だが、基本は数値対象）。