陕西理工学院开放性实验结题论文学生姓名丁侃所在班级专业01级计算机本科乙班所在系别数学与计算机科学系指导教师姓名周涛陕西理工学院数学与计算机科学系制2005年6月1日Apriori算法改进及其实现内容摘要信息技术的不断推广应用,将企业带入了一个信息爆炸的时代。如何充分利用这些数据信息为企业决策者提供决策支持成为一个十分迫切的又棘手的问题,人们除了利用现有的关系数据库标准查询语句得到一般的直观的信息以外,必须挖掘其内含的、未知的却又实际存在的数据关系。著名的Apriori算法是一种挖掘关联规则的算法。本文通过对参与候选集的元素计数的方法来减少产生候选集的组合和减少数据库的扫描次数来达到要求。这有利于提高挖掘的速度和减少数据库的I/O操作时间的开销。关键字:数据挖掘,关联规则,Apriori算法AprioriAlgorithmAndImprovedAprioriAlgorithmAbstract:--query,,thefamousalgorithmAprioriisamethod,'sI/'sprovedtobemoreefficientthanthetraditionalKeywords:Datamining,associationrules,Apriorialgorithm,目录1数据挖掘 -1- -1- -2- -2- -3-2数据挖掘的几种主要形式: -3-:规则挖掘: -3-: -4-3关于关联规则的讨论 -4- -4- -4- -6- -8-4Apriori算法的描述 -8- -8- -9- -11-5一种Apriori的改进算法 -14- -14- -15-: -15-附录1程序运行图示 -18-附录2程序代码 -20-(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。----何为知识?从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规则、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉,好像从矿石中采矿或淘金一样。原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面
apriori算法及其改进算法 来自淘豆网m.daumloan.com转载请标明出处.