第 30卷第 7期 计算机应用与软件 Vol30No.7
201oningofthedata,applyingiterativeoptimisationmethodtoadjustthefitnessbetweenthedata,soastogetthemaximum
intraclasssimilarity,andtoreachtheoptimalsolution.Experimentalresultsshowthattheproposedmixedattributesdataclusteringalgorithm
hasnoticeableadvantageoverotherapproaches.
Keywords Mixedattributesdata Graphpartition Spectralclustering
和符号型属性聚类,然后将这些结果看成是概念型数据,在其上
0 引 言 应用聚类算法得出结果。文献[11]中提出了一种基于扩展粗
集的层次聚类算法。用以上方法对混合类型数据进行聚类存在
实际应用中存在着大量的同时具有数值型和符号型属性的 随机性大、准确度不够高等缺点。把符号属性数据进行数值化,
混合属性数据,比如金融数据等,研究混合属性数据的聚类具有 存在着很大的人为意愿,跟客观规律相悖甚远。本文提出了一
重要意义。目前,大多数聚类算法只针对数值型属性数据或符 种基 于 图 划 分 的 混 合 属 性 数 据 的 聚 类 算 法 CBG(Clustering
号型属性数据,而对混合数据类型的数据聚类的效果不好。现 BasedonGraphpartition)。算法将一行属性值定义为一个图节
有经典的混合属性数据聚类算法研究工作主要有:文献[1]中 点,计算图节点的相似性,通过一种自适应自动调节属性权重的
方法将数值型和符号型属性的相似性统一成一个相似度矩阵,
提出一种基于贝叶斯理论的 AUTOCLASS算法,它是一种非监
一种基于图划分的混合属性数据聚类算法 来自淘豆网m.daumloan.com转载请标明出处.