HOMELv005 分散処理フレームワークApache Sparkにおいてインメモリ処理を行うための主要な抽象化データ構造はどれか。 2026年3月12日 RDD(Resilient Distributed Dataset)はSparkにおける基本的かつ不変の分散データコレクションである。 テキストデータを数値ベクトルに変換する手法「TF-IDF」の「DF」は何を指すか。 階層的クラスタリングの結果を木構造の図で表したものを何と呼ぶか。