K-means聚类算法
聚类分析概念
1
K-means算法
2
K-means实验-国民健康
3
K-means实验-图像分割
4
K-means实验-商户评级
5
目录
聚类与分类的不同在于:
分类简单来说,就是根据文本的特征或属性,划分到已有类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。
聚类的理解更简单,就是你压根不知道数据会分为几类,通过聚类分析将数据或者说用户聚合成几个群体,那就是聚类了。聚类不需要对数据进行训练和学习。
-means算法
Q1:K是什么?A1:k是聚类算法当中类的个数。
Summary:Kmeans是用均值算法把数据分成K个类的算法!
Q2:means是什么?A2:means是均值算法。
-means算法
距离的定义
欧式距离: N维空间点或向量的距离
曼哈顿距离: 城市街区距离
夹角余弦: 向量方向的差异
相关系数:
信息熵:
-means算法
K-means算法详解
步骤一:取得k个初始中心点
从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类
-means算法
K-means算法详解
Min of three
due to the EuclidDistance
步骤二:把每个点划分进相应的簇
根据欧氏距离最小原则,把每个点划分进相应的簇
-means算法
K-means算法详解
Min of three
due to the EuclidDistance
步骤三:重新计算中心点
根据均值等方法,重新计算每个类的中心点
-means算法
K-means算法详解
步骤四:迭代计算中心点
重复第二步和第三步
-means算法
K-means算法详解
步骤五:收敛
聚类中心不再发生移动
kmeans算法(算法+数据+代码) 来自淘豆网m.daumloan.com转载请标明出处.