下载此文档

基于K means聚类算法的研究.doc


文档分类:IT计算机 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
基于K_means聚类算法的研究.doc:..第35卷第1期文章编号:1003-2843(2009)01-0198-03基于K-means聚类算法的研究步媛媛1,关忠仁2(,卩4川成都610225; ,P461O娜)摘要:原始的 k-means算法[4]是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它',应充分利川已有数椐样本点的信息 .,也提商了算法诚终确定的聚类的精度 .关键词:数裾挖掘;聚类;k-means算法;聚类中心屮图分类号:TP392 文献标识码:A1引言聚类分析是数据挖掘中的一个重要功能,H前已应用于许多方而 :数裾挖掘和知识发现、模式识别和模式类、,这些方法包括分割与合并方法、--means是一种葙于划分的聚类算法,它的思想是当一个类确定后, ,图1是三个类的实际分布,图2取了较好的初始聚类中心(+字标记的数据对象足聚类中心)得到的结果,阁 ,图2所示的类内部数据对象相似度和类与类之间的相异度均髙于图3所示, 3所示之类的选収聚类中心的k-means算法的结果会导致聚类算法效率低 ,算法迭代次数较多 ,,从而获得图1三个类的实际分布 图2选取了较好中心的聚类结來 图3选取不好聚类中心的结來木文提出了一种寻找初始聚类屮心的方法, k-means聚类算法[4]-means聚炎算法收稿日期:2008-10-13作者简介:步媛媛(1984-),女,成都信息工程学院计算机系在读硕士研究虫;关忠什(1957-),男,成都信息工程学院网络屮心商级工程师,硕士生导师.—笫_1一期 步媛媛等:基于K-means聚类算法 的研_究199设待衆类的数掂集:X=x?,X2,E^(n ,k个聚类中心分别为Zi,i=1,2,....:定义1:两个数据对象间的欧几里徳距离为 ******@jXFiIXji||Xi2:Xj2!L |xUxjP这里的i=(Xii,Xi2,L,XiP)#j=(xji,xj2,L,xjP)是[^:准则函数E 2 2 2E=^l◄|pimi|2i1pCQ这里的E足数据库屮所奋对象的平方误差的总和,P足空间屮的点,表示给定的数据对象,m足簇 :首先是选取初始的聚类中心;其次是样木点分类;;是聚类中心的调整 .其屮后两个过程迭代交替进行 .卜‘

基于K means聚类算法的研究 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小博士
  • 文件大小160 KB
  • 时间2018-12-03