密级:——编号:——分类号:——骸!萃诰蛑屑尤ü亓9嬖算法的研究工学硕士学位论文论文提交日期:硕士研究生:指导教师学位级别学科、专业所在单位论文答辩日期:学位授予单位:翟罡张健沛教授工学硕士计算机软件与理论计算机科学与技术学院年日哈尔滨工程大学:
⑾至摘要数据挖掘是从大量的数据集中提取隐含的、事先未知的、并且潜在有用了萃诰蛘庋桓鲂碌难芯糠较颉萃诰蛴泻芏嘌芯咳鹊悖渲泄亓9嬖蛲诰蚴荳数据挖掘领域研究的一个重要方面。本文首先对数据挖掘、萃诰蚝蚖数据预处该算法中存在的问题。其一,.惴ń邢罴佑胁缓侠碇Γ其二,需要重复扫描数据库来计算候选项集的支持计数,从而严重影响了算——罴⒑,避免漏掉加权频遍事务数据库,减少了数据库的扫描次数;根据加权关联规则的性质,在计算候选项目集时进行两次减枝,减少了候选项目集的数量。实验结果表明,新算法在时间上地消耗明显少于瓵算法,有效提高了算法的效率;同时,新算法能有效减小候选顶集的规模。的知识过程。随着杆俜⒄梗チM系氖菰嚼丛脚哟蟆=挖掘的思想和方法应用到希饩鯳中遇到的一些问题,从而形成理等相关知识进行了阐述;然后研究了关联规则基本理论及关联规则经典算法:最后为了解决现实数据库中每个项目的分配不均匀性和重要性差异,重点研究了加权关联规则挖掘算法。法的运行效率;其三,瓵算法没有对候选项集进行剪枝,这样会保留许多无用的候选项集。针对上述三方面问题,本文给出了一种改进的算法惴ā8盟惴ǘ院蜓繁项集;利用事务标识号集合来计算候选项集的支持计数,这样只需扫描一关键词:萃诰颍还亓9嬖颍患尤ü亓9嬖颍籒算法哈尔滨工程大学硕士学位论文
%嗍篶矗鲁鏶姗;甒.,,印瑆琧哈尔滨工程大学硕士学位论文瓸琲瑄.,.瑃甌瑃..瓼,.,,.瑂狝痶,,猰.,,
..瑃哈尔滨工程大学硕士学位论文,:;粀
;写罱擀作者┳:翟星年弓月‘日学位论文原创性声明哈尔滨工程大学学位论文授权使用声明释瞿作者本人独立完成的。有关观点、方法、数据和文献的引用已在本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。本人完全了解学校保护知识产权的有关规定,即研究生在校工程大学有权保留并向国家有关部门或机构送交论文的复印件。库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文,可以公布论文的全部内容。同时本人保证毕业后结合尔滨工程大学。涉密学位论文待解密后适用本声明。胡年翴本人郑重声明:本论文的所有工作,是在导师的指导下,由文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对作者┳:日期:弧耗月日攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈本论文谠谑谟柩缓蠹纯口在授予学位个月后口解密后晒豕こ檀笱徒挥泄夭棵沤斜4妗⒒惚嗟取㈠
第绪论研究背景哈尔渎卫程大学硕士学位论文当今数据库技术和数据库管理系统得到了广泛应用,全球范围内数据库是非常困难的,人们需要对数据进行处理,从中找出并发现规律,以帮助人糊的、随机的数据中提取隐含在其中的、人们事先不知到的、但又是潜在有用的信息和知识的处理过程⋯。数据挖掘是一个多学科交叉研究领域,它融合了数据库技术、人工智能、机器学习、统计学、知识工程、面向对象方法、索引擎只解决了信息查询的问题,而人们迫切地希望能够从峡焖佟⒂境下的应用,是从大量的牡导虾驮谡镜隳诮袖赖南喙厥葜蟹现蕴涵的、未知的、有潜在应用价值的、非平凡的模式的过程。萃诰虻难芯磕壳爸饕<性谌龇矫妫篧内容挖掘结构挖掘D壳埃琖数据挖掘已经成功应用到很多领域。诸如银行、交通、电信、保险、电子商务、客户关系管理、网络广告分析领域。中存储的数据量急剧增大,有些公司的商业数据目前已经超过几百万条记录。有些面向科学研究数据库的数据量也非常惊人。庞大的数据对人工处理来说们更好地进行决策和研究。数据挖掘是从大量的、不完全的、有噪声的、模信息检索、高性能计算以及数据可视化等最新技术的研究成果。在该头⒄沟耐保嗣且裁媪僮拧靶畔⒈ǘJ镀斗Α钡奈题。在信息量极大丰富的试粗校毯糯罅壳痹诘挠屑壑档闹J丁K效地发现知识。因此人们需要比信息检索层次更高的新技术,被称之为中的知识发现,即萃诰颉数据挖掘是数据挖掘技术在日志挖掘萃诰虻闹饕H挝癜ㄔげ饨!⒐亓7治觥⒕劾喾治觥⒁斐<测等。其中关联规则作为萃诰蛑凶钗H让诺难究课题之一,其挖掘目标是从异构的数据库中找出数据项之间的关联关系,
研究现状誓量—■宣审它实际上是一种知识表示形式。关联规则是由等人在对市场购物篮库中的顾客购买模式。关联规则可以应
Web数据挖掘中加权关联规则算法的研究 来自淘豆网m.daumloan.com转载请标明出处.