下载此文档

基于加权向量提升的多尺度聚类挖掘算法.pdf


文档分类:IT计算机 | 页数:约58页 举报非法文档有奖
1/58
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/58 下载此文档
文档列表 文档介绍
中图分类号: TP391 密级: 公开
UDC: 620 学校代码: 10094



硕士学位论文
(学历硕士)

基于加权向量提升的多尺度聚类挖掘算法
Weight Vector Based Multi-scale Clustering
Algorithm



作者姓名: 苏东海
指导教师: 赵书良 教授
学科专业: 计算机应用技术
研究方向: 数据挖掘
论文开题日期: 2013 年 03 月 29 日




I
摘 要
数据挖掘(Data Mining,DM)是从包含相对复杂结构的海量动态数据库中提取潜在
的、未知的、和有用知识的过程[1],因此也被称作数据库中的知识发现(Knowledge
Discovery in Database,KDD)。聚类[2]作为数据挖掘领域中的重要研究内容得到了长足
的发展,聚类主要实现以下目的:将数据集中的对象分成若干类簇,以达到类簇内对象
尽可能相似,而类簇间对象尽可能相异。目前有关聚类挖掘的研究已基本成熟,而当前
社会是一个“跨界”的社会,将聚类挖掘技术应用于其它学科越来越受到学者们的重视,
而多尺度科学[3,4]作为一门新兴学科,其相关研究也变得炙手可热,将聚类挖掘同多尺度
科学结合起来实现多尺度聚类挖掘变得越来越重要。
目前,多尺度聚类挖掘有了一定的研究进展,如学者孙庆先将多尺度的数据挖掘归
纳为三种途径[4]:在挖掘前将单一尺度的数据转换成多个尺度的数据,然后对多个尺度
的数据分别进行挖掘,即实现数据的多尺度转换;在挖掘算法中引入调节尺度用的操作
部件,以控制挖掘出知识的尺度;将挖掘出的单一尺度的知识转换成多个尺度的知识,
即完成知识的多尺度转换。通过前两种途径可以很容易地实现多尺度挖掘,但遇到的一
个严重的问题就是需要在每一个尺度上应用挖掘算法。途径 3 还很少有人研究,本文对
本途径进行探索,提出了一种新的算法,以解决前两种途径的多尺度聚类挖掘中所遇到
的问题。本文的主要工作内容如下:
提出了一种基于向量的多尺度表示方法。尺度存在于各种类型的数据库中,而不同
类型的数据,其尺度的表达方式也不同,为尺度大小的比较、尺度转换工作带来了不便。
本文基于向量的思想将不同数据类型的尺度表示成统一的向量形式,以方便尺度间的比
较、转换操作,并为本文算法的提出奠定了基础。
提出了一种基于加权向量提升的多尺度聚类挖掘算法,来完成在不同尺度上聚类的
目的。算法的基本思想即是多尺度挖掘的第三种途径:首先,该算法选定一个基准尺度,
并在该基准尺度上应用聚类挖掘算法以获取该尺度上的聚类结果;其次,对于用户感兴
趣的其它尺度,通过应用尺度转换机制将基准尺度上的聚类结果反演出目标尺度的聚类
结果,进而完成多尺度的聚类挖掘。
将本文提出的算法应用于 H 省流动人口分析当中,进一步验证了本文算法的可行性
和有效性。实验表明,该算法是可行和有效的,其聚类结果可以为相关领域的决策者提
供科学的指导依据。
1
关键词:多尺度、多尺度转换、聚类挖掘、多尺度聚类
2
Abstr

基于加权向量提升的多尺度聚类挖掘算法 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数58
  • 收藏数0 收藏
  • 顶次数0
  • 上传人陈潇睡不醒
  • 文件大小1.34 MB
  • 时间2021-09-06
最近更新