摘要随着数据库应用的不断深化,数据库的规模急剧膨胀,人们需要对这些数据进行分析,从中发现有价值的信息。但是数据库管理系统本身却没有提供有效的工具和方法来利用这些数据,因此数据挖掘成为当今研究的热点。特别是其中的分类问题,由于其使用的广泛性,现已获得了越来越多的关注。本文即以混合智能系统为基础对数据挖掘中的分类问题进行系统研究。作者综述了国内外数据挖掘分类的研究现状和应用成果,深入分析了分类问题的基本理论,并介绍了经典算法,以及对各种分类方法学、模型集成理论为基础,集粗糙集理论、聚类理论、模糊逻辑理论、遗传算法理论、人工神经网络理论于一体的一个新的混合智能系统将简化后的数据进行聚类,对不同的聚类使用经过遗传算法改进了的神经网络进行训练,接着将这些经过不同神经网络训练的数据用模糊权值组合起来,放入新的用遗传算法改进了的神经网络再进行训练,从而完成分类的整个训练过程。最后,作者根据系统的各个子模块分别进行设计、实现,并在环境下进行系统组装,开发了一个新的混合智能系统墓ぞ呦洹!b鞢。并用碌氖导适菘舛本文提出的混合智能系统氖涤眯越辛思煅椋玫搅吮关键词数据挖掘,分类,混合智能系统,人工神经网络,聚类进行了综合比较。在基本理论分析的基础上,作者构建了以认知心理K韧ü植诩淙胧萁性技颍缓笥镁劾嗉际较满意的结果。
..一姆琧痵..!——、,瓵..瑃。疭瓼,—..甋甃非逪疭維—,,,’’Ⅱ
玉:盈:日期:丝生年卫月—丛日原创性声明关于学位论文使用授权说明的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我作者签名:论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文;学校可根据国家或湖南省有关部门规定送交学位论文。
,但是拥有大量的数据与拥有许多有用的知识完全是两回事。世纪年代末,随着数据库、互联网技术的迅速发展,以及管理信息系统巴缡葜行的推广应用,数据的存取、查询、描述统计等技术日臻完善,但高层次的决策分析、知识发现等实用技术还很不成熟,导致了“信息爆炸”但“知识贫乏”的现象。到了年代,人们提出在数据库基础上建立数据仓库,应用机器学习和统计分析相结合的方法处理数据,这两者的结合促成数据挖掘,简称际醯牡啊!一般认为数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据库中,提取隐含在数据中人们事先不知道但又是潜在有用知识的技术和过程“饫铮哟罅渴葜谢袢≈J队辛礁霾愦蔚暮澹菏紫龋肟蒲Х⑾钟关。从观测客观世界的大量实验数据鞘中发现数据的整体结构特性和数据之闻的函数关系,并根据统计特征推断客观世界存在的规律性。其次,与商业数据等事实数据所构成的数据库中发现其中隐含的规则或规律性有关。在这里第二层是将人工智能技术与数据库理论相融合的应用性研究课题。本文的研究对象也限于此。数据挖掘是一个交叉学科领域,受多个学科影响,如图荆ㄊ菘饧际酢⑼臣蒲А⒒餮啊⒖墒踊托畔⒖蒲У取近年来数据分类正在迅速发展。分类分析应用于许多研究领域,包括数据挖掘、统计学、生物学、市场营销、机器学习及空间数据库技术。由于数据库中收集了大量的数据,分类分析已成为数据挖掘研究领域中一个非常活跃的研图萃诰蚴芏嘌Э频挠跋硕士学位论文
智能领域最新提出的技术——混合智能系统引入,通过将各种方法有机结合起究课题。虽然现在关于分类的算法已有很多,并且有的还很成熟,但是面对如今的海量数据,一些算法在时间效率、鲁棒性、精确性上已存在一些问题。并且从数据挖掘在国际上的发展来看,数据挖掘的研究重点现己从提出概念和发现方法转向系统应用和方法创新上,研究注重多种发现策略和技术集成,以及多种学科之间的相互渗透,数据挖掘迫切需要系统科学的理论体系作为其发展的支撑。如何解决这些问题,一些学者已开始将数据挖掘三大支柱之一的人工来,扬长避短,以获得各种模型整合功效,、发展、应用的原因:超大规模数据库的出现、计算机技术的快速发展、经营管理的实际需要和对这些数据的精蠊婺J菘獾某鱿超大规模数据库,尤其是数据仓库的出现,促使数据挖掘得到迅速发展与应用。依靠计算机自动收集的各种业务处理数据,使许多大规模数据库或数据仓库拥有大量的业务处理数据、市场变化数据,使数据挖掘技术有了赖以生存的基础。如果没有这些大规模数据库,很难想象数据挖掘技术对什么进行挖掘。扑
基于混合智能系统的数据挖掘分类算法的研究(可复制毕业论文) 来自淘豆网m.daumloan.com转载请标明出处.