下载此文档

分类属性数据聚类算法研究.pdf


文档分类:IT计算机 | 页数:约71页 举报非法文档有奖
1/71
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/71 下载此文档
文档列表 文档介绍
江苏大学
硕士学位论文
分类属性数据聚类算法研究
姓名:王敏
申请学位级别:硕士
专业:模式识别与智能系统
指导教师:林庆
20080606
摘要现代数据库和网络技术的发展,使得人们面对的数据量以惊人的速度增长。为了获取有价值的信息,聚类分析已成为数据挖掘中一个十分活跃的研究领域。本文详细介绍了聚类分析的基本概念、数据类型和相异度测量方法,分类方法和特点,并对聚类结果的评价方法进行了讨论。随着数据类型的多样化,聚类分析也要求能够处理各种各样类型的数据。本文重点讨论的是对分类属性数据的聚类算法研究。围绕分类属性数据的聚类问题,研究较为深入的是划分法聚类。首先具体研究了典型的甿算法及其变形,并指出了它们的优缺点,对它的相异度作了一个小的改进,并应用在构建合作学习小组中;探讨了模糊甿算法和进化策略对属性进行加权的改进如甿算法,以及近似甿掷嗍粜允菥劾嗨惴ǎ没诨窒嗨贫鹊木劾嗑范任聚类结果的评价准则,实验分析了它们的聚类效果。其次研究了引用熵的概念来对分类属性数据木劾啵简单地描述了熵的一些基本性质,介绍了三个基于熵的聚类算法,接着我们用增益熵作为引力模型的距离半径,构建的熵函数作为引力和加速度,聚类中的数目作为质量来形象地描述引力模型的分类属性数据的聚类算法的聚类过程。用分类的效率、期望熵值和纯度这三个聚类评价准则来衡量聚类的结果。为了有所比较,ê惴ㄉ希幢冉险馊咚惴ǖ木劾嘈Ч最后是提出了一种在子空间里无重叠分类属性数据的聚类算法。新的无重叠聚类算法用紧凑函数和分散函数之和作为目标函数,最小化得到它的最终聚类结果。分别用在菘獾个分类属性数据集中,聚类的结果分别显示了它们的各个类别所在的子空间类集。江苏大学硕士学位论文蚔,
随着数据库的发展,计算机的更广泛的应用,必然带动分类属性数据上更广泛的研究和应用,在基于熵的概念和高维子空间上的聚类研究也会得到更进一步的完善与发展。关键词:聚类分析,分类属性数据,熵,子空间江苏大学硕士学位论文
,琲,闘.:甇,:..,【.,琤..仃。
删,:.蒩如ゝ。.緀,·琣·,甌如.,.,。
学位论文作者签名:互叙日期:∥孵多月//日独创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已注明引用的内容以外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。江苏大学硕士学位论文
溯年多月//日跏萨夕月学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权江苏大学可以将本学位论文的全部内容或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密年解密后适用本授权书。本学位论文属于学位论文作者签名:指导教师签名:口,在不保密回。江苏大学硕士学位论文
上重新定义了差异度函数。之后引入模糊的概念又产生了呦甿懿【亢臀研究较为深入的是划分聚类算法,緂提出了菜惴ê蚹惴ɡ唇第绪论甿牡人惴ㄊ蔷劾啻笫菁挠行Ш凸惴翰捎玫囊恢志劾嗨惴āH欢淼研究背景及意义畃】【算法,用实际数据中的样本点来代替模式的近似甿劾嗨惴ǖ聚类分析是一个古老的问题,它伴随着人类社会的产生和发展而不断深化,人类要认识世界就必须区别不同的事物并认识事物间的相似性。近十几年来,随着计算机计算机技术的迅猛发展,人们获取与采集数据的能力大大提高,信息量以前所未有的迅速增长,互联网的发展更是为我们带来了海量的数据和信息。但存储在各种数据媒介中的数据,在缺乏有力的分析工具的情况下,已经超出了人的理解和概括能力,基于此,作为数据挖掘的一种有效工具,聚类分析引起了人们的广泛关注,也得到了许多成功的应用。.芯勘尘由于所需要处理的数据具有不同的特性,表现在数据量巨大、分布模式不同以及数据特征类型不同等等方面,就出现了不同的聚类算法,各个聚类算法也是各有所长。随着数据类型的多样化,聚类分析也要求能够处理多种类型的数据。基于划分的数据对象仅限于数值型数据。大多数实际的数据库和大的数据集不仅包括数值类型的数据而且包括大量的非数值类型数据,如二值型,名义型,在很多时候它们被称为分类属性数据分类属性数据的属性是有限和无序的,而且不能比较大小,数据间缺乏一种合理的相似度量,因此用于数值型的聚类算法不适合于处理分类属性数据,现在新的适用于非数值类型数据的聚类方法开始得到越来越多的研究与发展。围绕分类属性数据类型的聚类问题,专家学者提出了很多新的概念和方法。其中

分类属性数据聚类算法研究 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数71
  • 收藏数0 收藏
  • 顶次数0
  • 上传人977562398
  • 文件大小2.61 MB
  • 时间2018-01-23