下载此文档

数据挖掘中的演化数据聚类算法研究.pdf


文档分类:IT计算机 | 页数:约64页 举报非法文档有奖
1/64
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/64 下载此文档
文档列表 文档介绍
杭州电子科技大学硕士学位论文






数据挖掘中的演化数据聚类算法研究






研 究 生:张 东 升
指导教师:方 景 龙 研究员




2013 年 12 月
Dissertation Submitted to Hangzhou Dianzi University
for the Degree of Master



A Study on the Evolutionary Clustering
in Data Mining








Candidate: Zhang Dongsheng
Supervisor: Prof. Fang Jinglong




December, 2013
杭州电子科技大学硕士学位论文
摘要
数据挖掘技术是一种从海量数据中获取有用信息与知识的有效手段,是多门
学科融合的结晶,具有重要的实用价值和广阔的应用前景。数据挖掘技术在蓬勃
发展的同时也面临着挑战,传统的数据挖掘技术只能处理静态数据库中的数据,
但在实际的应用中数据往往是动态变化的,演化数据就是这样的一种数据,其数
据的分布随着时间的变化而变化,传统的数据挖掘技术无法处理这种问题,因此
研究专门的处理演化数据的算法就很有必要。
演化数据聚类是演化数据学习的重点和难点,本文对演化数据聚类进行研究
提出了二种指数衰减的演化数据聚类框架,根据平滑正则项含义的不同和选取的
原型算法的不同得到了四种具体的演化数据聚类算法:KM-ED-PCQ 算法、
NC-ED-PCQ 算法、KM-ED-PCM 算法和 NC-ED-PCM 算法。本文主要研究了以
下三方面的内容:
首先,本文简要地介绍了数据挖掘和传统的聚类分析技术,然后研究了演化
数据的聚类问题,阐述了演化数据本身的特点,演化数据聚类的研究现状,常用
的演化数据聚类方法等,并 对典型的显式建模聚类方法和平滑正则聚类方法进行
了对比分析。
其次,针对平滑正则聚类方法的聚类结果不够平滑的问题,本文增加了时间
正则项,并使用指数衰减的思想来表现不同时刻的时间正则项的影响,根据时间
正则项含义的不同得到二种演化数据聚类框架 ED-PCQ 和 ED-PCM,分别将 K-means
算法和谱聚类算法作用于上述框架得到了四种实用的指数衰减的演化数据聚类
算法。
最后,通过在高斯数据集和 KDD-CUP99 数据集上的实验,验证了本文提出的
算法是可行的有效的,而且得到了时间正则项的数目与聚类变化度的关系,这为
实际的计算带来了方便。
综上所述,本文提出的两种指数衰减的演化数据聚类框架能够有效地处理演
化数据的聚类问题,具有较强的理论价值和实际意义。

关键词:数据挖掘,演化数据,聚类,指数衰减

数据挖掘中的演化数据聚类算法研究 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数64
  • 收藏数0 收藏
  • 顶次数0
  • 上传人zhufutaobao
  • 文件大小2.21 MB
  • 时间2021-11-15