下载此文档

基于划分的联机聚类算法分析.docx


文档分类:IT计算机 | 页数:约68页 举报非法文档有奖
1/68
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/68 下载此文档
文档列表 文档介绍
承诺书
本人声明所呈交的硕士学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京航空航天大学或其他教育机构的学位或证书而使用过的材料。
本人授权南京航空航天大学可以将学位论文的全部或部
分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。
(保密的学位论文在解密后适用本承诺书)
作者签名: 日 期:
摘 要
随着信息技术的发展,数据流模型已成为诸多应用的常用模型,其固有特点也致使传统聚类算法在此模型上面临严峻挑战。其次,一系列数据流聚类算法虽相继被提出,但仍存在诸多不足, 如现有基于划分的数据流聚类算法难以处理非线性和高维数据等。对此,本文侧重于基于划分的联机聚类算法研究,具体如下:
(1) 基于核模糊C-均值(KFCM),提出了一种针对大规模数据的联机核模糊C-均值聚类算法(OKFCM),同时考虑到核参数的选择困境,借鉴多核学习思想,通过组合不同参数的多个核, 进一步衍生出了联机多核模糊C-均值聚类算法(OMKFCM)。由此,在有效缓和核参数选择难题的同时,核联机算法不仅继承了KFCM优越的聚类特性,在某种程度上还拥有了集成算法的优势。
(2) 基于模糊 C-均值(FCM),提出了一种针对高维数据的联机局部自适应模糊 C-均值聚类算法(OLAFCM)。OLAFCM 通过为各类特征属性分别赋以相应的局部权重,使各个类分布在不同属性组合的张量子空间内,从而有效避免现有数据流聚类算法在高维空间中面临的“维数灾难”等难题。此外,考虑到输入参数对领域知识的依赖性难题,进一步发展出了基于凝聚的联机局部自适应模糊 C-均值聚类算法(OLAFCM_CA)。在人工和真实数据集上的实验结果显示, 所提出的新算法成功缓解了对初始化聚类类数的敏感性难题,且比现有基于全局降维的划分联机算法具有更好的聚类性能。
关键词:核方法,特征选择,联机核模糊 C-均值聚类,联机多核模糊 C-均值聚类,联机局部自适应模糊 C-均值聚类,基于凝聚的联机局部自适应模糊 C-均值聚类
ABSTRACT
With the development of the information technology, the data stream has e monly used model. Because of the characteristics of data stream, traditional clustering algorithms have met a lot of challenges. In addition, a series of data stream clustering algorithm have been proposed, but there are still many ings, such as when the cluster boundary is not linearly separable or the data dimension is too high, the data stream clustering algorithms based on partition methods achieve low accuracy results. So this paper proposes two online partition clustering algorithms based on kernel methods and feature selection, respectively. The details are as follows:
Firstly, a new online kernel fuzzy c -means (OKFCM) algorithm for large scale datasets based on kernel fuzzy c- means (KFCM) is proposed. OKFCM not only inherits the robust clustering properties of the original KFCM, but also suitable for clustering data streams. In addition, taking into account the difficulties in selecting kernel parameters, a new online multiple kernel fuzzy C-means algorithm (OMKFCM) bining m

基于划分的联机聚类算法分析 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数68
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wz_198613
  • 文件大小1.49 MB
  • 时间2018-05-15