学校代号:10536 学号:********** 密级:公开长沙理工大学硕士学位论文基于禁忌搜索和相似度的聚类算法研究学位申请人姓名睦圈指导教师罗可麴援所在学院过箕扭生通信王猩堂暄专业学位领域过篡扭基盔论文提交日期 2Ql垒生垒旦论文答辩日期 2Q!垒生』旦答辩委员会主席整塞堡麴攫万方数据 Y2756747 Research on Clustering Algorithm Based on Tabu SearchAlgorithm andSimilari锣Measurement by CHEN Yang .(Hunan Agricultural University)2012 Athesissubmitted inpartial satisfaction ofthe Requirements forthedegree of Master puter Technology Changsha University ofScience&Technology Supervisor Professor Luo Ke April,2014 万方数据长沙理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名稻、彻蹶娜年‘月y日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权长沙理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研究所将本论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。本学位论文属于1、保密口,在——年解密后适用本授权书。 2、不保密团。(请在以上相应方框内打“√”) 作者签名:傅确导师签名:黑歹日期:z,f哗f月了日日期:≯/Ir年 6月g目万方数据摘要在这个“信息爆炸”的时代,人们经常面对着海量的数据,例如海量文本数据、Web数据、多媒体数据等,而这些数据中隐藏着大量的对人们有用的重要信息,如何用某种有效手段,从这些海量数据中提取出这些潜在有用的、可以用于提供决策支持的信息,数据挖掘便应运而生了。聚类作为数据挖掘的一个重要分支,对人们的日常生活都产生非常重要的影响。现在聚类主要的技术可以分为: 划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法。本文的主要研究工作包括下面两个方面; ,探讨K—medoids算法的不足,提出了一种基于改进禁忌搜索的K—medoids聚类算法。禁忌搜索算法是模拟人类短暂记忆的一种优化算法,具有很强的全局搜索能力。针对禁忌搜索算法比较依赖初始解的缺点,将粒计算和最大距离积算法相结合,将改进后的禁忌搜索算法提高了K-medoids聚类的准确率,有较强的稳定性。通过仿真实验, 验证了该方法的可行性。 ,传统的低维的距离计算相似性的方法不合适用在高维空间中,提出了一种新的相似性度量方法。通过计算对象之间的相似度得到相似矩阵,结合层次聚类的思想,自底向上的对数据进行聚类分析。通过有效性分析,论证了该方法可行性。关键字:数据挖掘:;禁忌搜索;相似性度量万方数据 ABSTRACT Inme era of”information explosion”,we ale oftenfaced withthemassive data, such asthemassive textdata,Web data,multimedia data,and those data11ide alotof useful and important toextract thatpotential information which Can beused tosupport decision using some effective methods leads tothebirthofdata one oftheimportant branch ofdatamining,clustering has agreatimpact on people。Sdaily technologies ofexisting clustering Callbedivided into
基于禁忌搜索和相似度的聚类算法研究. 来自淘豆网m.daumloan.com转载请标明出处.