Mahout 算法 一、分类算法 二、聚类算法 三、推荐算法 四、关联规则挖掘算法 五、回归 六、降维 七、进化算法 八、向量相似性计算

Mahout 算法
一、分类算法

二、聚类算法

三、推荐算法

四、关联规则挖掘算法

五、回归

六、降维

七、进化算法

八、向量相似性计算

Mahout 包括协同过滤,基于UserItem的推荐;kmeansFuzzy-kmeans Mean shift Dirichlet process LDA聚类;奇异值分解;并行频繁项集挖掘;补充的贝叶斯分类、随机森林决策树分类。

(一)Logistic 回归(SGD

(二)Bayesian 

(三)SVM

(四)Perceptron Winnow

(五)神经网络

(六)随机森林

(七)受限玻尔兹曼机

(八)Boosting

(九)HMM

(十)Online Passive Aggressive

二、聚类算法

(一)Canopy

(二)K-Means

(三)Fuzzy K-means

(四)EM

(五)Mean shift

(六)层次聚类

(七)Dirichlet process 

(八)LDA

(九)Spectral 

(十)MinHash

(十一)Top Down

三、推荐算法

           Mahout包括简单的非并行的推荐和基于Hadoop的并行推荐的实现。

(一)非并行推荐

(二)分布式的基于Item的协同过滤

(三)并行矩阵分解的协同过滤

四、关联规则挖掘算法

 

并行FP-Growth 

五、回归

Locally Weighted Linear Regression

六、降维

(一)SVD

(二)SSVD

(三)PCA

(四)ICA

(五)GDA

七、进化算法

八、向量相似性计算

(一)RowSimilarityJob 

用于计算Item之间的距离,是分布式的。

(二)VectorDistanceJob 

Map端连接,计算向量集中两两向量之间的距离。