下载此文档

关联规则算法研究与应用.pdf


文档分类:IT计算机 | 页数:约58页 举报非法文档有奖
1/58
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/58 下载此文档
文档列表 文档介绍
西南交通大学
硕士学位论文
关联规则算法研究与应用
姓名:朱丽雅
申请学位级别:硕士
专业:交通信息工程与控制
指导教师:楼新远
20080707
要摘了快速更新频繁闭合项目集算法西南交通大学硕士研究生学位论文第关联规则描述了给定数据集中项与项间的有趣联系。目前对海量数据集关联规则的研究主要集中在生成频繁闭项集的挖掘算法上。然而,有关频繁闭项集的更新还不多见。为此针对频繁闭项集的主流算法疚提出了高效更新算法。本文首先介绍了数据挖掘和关联规则的概念;然后按照耆频繁项集挖掘、频繁闭项集和最大频繁项集挖掘、并行和分布式挖掘,以及增量更新等几个热点研究方向,对数据挖掘算法中的一些典型方法作简单评述,并着重实验分析经典算法在不同数据集的适用性。惴ú捎没旌贤队安呗裕惴ㄔ谠诵惺奔洹⒛诖婕翱衫┱剐苑面都超过大多数频繁闭项集挖掘算法。针对惴ǖ奈の侍馓岢,该算法主要考虑最小支持度发生变化时频繁闭合项目集的更新情况。在最坏的情况下仅须扫描各局部数据库一遍,且利用南钅考并、子项目集修剪以及子集检验等优化策略及已挖掘的结果,可确保对频繁闭合项目集进行高效的更新。实验表明该更新算法是有效的。文章最后以人寿保险和交通事故数据挖掘为实例分析了关联规则在相关行业系统的应用。关键词:数据挖掘:关联规则;频繁闭项集;增量式更新
瑆篋西南交通大学硕士研究生学位论文第页.:.,;;.;;;,.,琲甶...畉,琧瓵,甀,甀,,現畉
指子著海τ学位论文作者签名:眷硒往日期:、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。本学位论文属于C芸冢年解密后适用本授权书;朐谝陨戏娇蚰诖颉啊日期:
西南交通大学学位论文创新性声明目集算法一本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确的说明。本人完全意识到本声明的法律结果由本人承担。本学位论文的主要创新点如下:针对算法的维护问题提出了快速更新频繁闭合项,该算法主要考虑最小支持度发生变化时频繁闭合项目集的更新情况。最坏的情况下仅须扫描各局部数据库一遍,且利用囊挖掘的结果,可确保对频繁闭合项目集进行高效的更新。
第滦髀选题的背景与意义西南交通大学硕士研究生学位论文第随着信息技术的高速发展,数据库应用的规模、范围和深度已经从点台机器⒄沟矫网络踔恋絀蛐畔⑾低常沟梦蘼凼巧桃怠企业、科研机构或政府部门,在过去若干年的时间里都积累了海量的、不同形式存储的数据资料。这些资料十分繁杂,仅仅依靠数据库的查询检索机制和统计学方法已经远远不能满足现实的需要,因此它迫切要求自动地和智能地将待处理的数据转化为有用的信息和知识,从而达到为决策服务的目的。在这种情况下,数据挖掘技术应运而生。数据挖掘正是为了迎合这种需要而产生并迅速发展起来的、用于开发信息资源的、一种新的数据处理技术。数据挖掘通常又称数据库中的知识发现:兰甏萃诰蚣际跤υ硕⒀杆俜⒄蛊鹄矗今,数据挖掘己经成为数据库和决策支持领域的研究热点。其中,挖掘大型事务数据库中的关联规则是数据挖掘研究的重要问题之一。数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的。该问题自提出以来,一直受到广泛关注与重视,成了研究的热点。迄今为止,关联规则挖掘已经被应用到很多领域,例如零售业、市场营销、医学等、交通运输、银行保险、电信等行业,为各个领域的决策支持提供了一个有效的手段。数据密集型的各种行业经过多年的运营,也已经积累了海量的历史数据,这些数据是公司的重要财富。要从这些大量数据中获取能给公司带来无限商机的有价值信息,急需更高效的数据处理方法和技术。此时数据挖掘技术显示出了它特有的优越性。本文在数据挖掘背景下展开了关联规则挖掘的研究工作。
关联规则现状与热点问题研究西南交通大学硕士研究生学位论文第数据挖掘的发展和挖掘过程与任务的演变紧密相关,即数据挖掘的发展离不开算法与应用,一方面必须体现数据挖掘过程循环迭代的本质,另一方面必须实现各种复杂的数据挖掘任务,经过多年工作,相关研究与应用已取得了很大的成果。按照耆频繁项集挖掘、频繁闭项集和最大频繁项集挖掘、并行和分布式挖掘,以及增量更新等几

关联规则算法研究与应用 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数58
  • 收藏数0 收藏
  • 顶次数0
  • 上传人DOC KING
  • 文件大小0 KB
  • 时间2011-11-09