下载此文档

大数据经典算法Kmeans讲解.ppt


文档分类:IT计算机 | 页数:约28页 举报非法文档有奖
1/28
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/28 下载此文档
文档列表 文档介绍
该【大数据经典算法Kmeans讲解 】是由【qinqinzhang】上传分享,文档一共【28】页,该文档可以免费在线阅读,需要了解更多关于【大数据经典算法Kmeans讲解 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。(优选)大数据经典算法(Fa)Kmeans讲解
第一页,共二十八页。
聚类算(Suan)法简介
1
2
3
聚类的目标:将一组向量分成若干组,组内数据是相似的,而组间数据是有较明显差异。
与分类区别:分类与聚类最大的区别在于分类的目标事先已知,聚类也被称为无监督机器学习
聚类手段:传统聚类算法①划分法②层次方法③基于密度方法④基于网络方法⑤基于模型方法
第二页,共二十八页。
什么(Me)是Kmeans算法?
Q1:K是什么?A1:k是聚类算法当中类的个数。
Summary:Kmeans是用均值算法把数据分成K个类的算法!
Q2:means是什么?A2:means是均值算法。
第三页,共二十八页。
Kmeans算(Suan)法详解(1)
步骤一:取得k个初始初始中心点
第四页,共二十八页。
Kmeans算法(Fa)详解(2)
Minofthree
duetotheEuclidDistance
步骤二:把每个点划分进相应的簇
第五页,共二十八页。
Kmeans算法详(Xiang)解(3)
Minofthree
duetotheEuclidDistance
步骤三:重新计算中心点
第六页,共二十八页。
Kmeans算法(Fa)详解(4)
步骤四:迭代计算中心点
第七页,共二十八页。
Kmeans算(Suan)法详解(5)
步骤五:收敛
第八页,共二十八页。
Kmeans算法流(Liu)程
从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类
计算数据中所有的点到这k个点的距离,将点归到离其最近的聚类里
调整聚类中心,即将聚类的中心移动到聚类的几何中心(即平均值)处,也就是k-means中的mean的含义
重复第2步直到聚类的中心不再移动,此时算法收敛
最后kmeans算法时间、空间复杂度是:
时间复杂度:上限为O(tKmn),下限为Ω(Kmn)其中,t为迭代次数,K为簇的数目,m为记录数,n为维数
空间复杂度:O((m+K)n),其中,K为簇的数目,m为记录数,n为维数
第九页,共二十八页。
决(Jue)定性因素
Input&centroids
Selectedk
MaxIterations&Convergence
Meassures
①数据的采集和抽象
②初始的中心选择
①最大迭代次数
②收敛值
①k值的选定
①度量距离的手段
factors?
第十页,共二十八页。

大数据经典算法Kmeans讲解 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数28
  • 收藏数0 收藏
  • 顶次数0
  • 上传人qinqinzhang
  • 文件大小5.65 MB
  • 时间2023-02-27