Spark Mllib里如何将trainDara训练数据的分类特征字段转换为数值字段(图文详解) Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章 使用决策树二元分类算法来预测分类StumbleUpon数据集

  不多说,直接上干货!

Spark Mllib里如何将trainDara训练数据的分类特征字段转换为数值字段(图文详解)
Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章 使用决策树二元分类算法来预测分类StumbleUpon数据集

   字段3 是分类特征字段,但是呢,在分类算法里不能直接用。所以,必须要转换为数值字段才能够被分类算法使用。

具体,见