1.1 无监督学习简介 Unsupervised learning introduction

之前学习的监督学习都是在训练集有标签的前提下，找到一个决策边界来区别正类和负类

机器学习笔记11
聚类
1.1 无监督学习简介 Unsupervised learning introduction
1.2 K均值算法 K-means algorithm
1.3 目标优化 Optimization objective
1.4 随机初始化 Random initialization
1.5 选择聚类数量 Choosing the number of clusters

而无监督学习的训练集无标签的，通过算法对数据进行分类

无监督学习的应用：

1.2 K均值算法 K-means algorithm

先来学习第一个无监督算法：聚类算法，在聚类算法中比较经典那肯定是K均值算法了

K均值算法其实就是先随机初始化K个聚类中心，通过数据点与聚类中心的距离来更新数据点的类别，最后再对距离中心进行更新，通过不断的迭代，直到所有数据点都不更新了

以下为K均值算法的更新过程：

K均值算法的详细过程如下：

在分类情况不明确的情况，照样可以使用K均值算法

1.3 目标优化 Optimization objective

在监督学习中，线性回归和逻辑回归都有目标优化，最小化其代价函数。那其实在无监督学习中也是有的

在K均值算法中，目标优化就是要最小化所有数据点与其所关联的聚类中心点之间的距离之和，所以K均值的代价函数为：机器学习笔记11
聚类
1.1 无监督学习简介 Unsupervised learning introduction
1.2 K均值算法 K-means algorithm
1.3 目标优化 Optimization objective
1.4 随机初始化 Random initialization
1.5 选择聚类数量 Choosing the number of clusters