最大频繁项集挖掘算法综述摘要:关联规则挖掘是近年来数据挖掘领域中一个相当活跃的领域,频繁项集挖掘是关联规则挖掘中最重要的任务。最大频繁项集的规模远远小于频繁项集的规模,通过最大频繁项集可以导出所有的频繁项集,因此进行了很多专门挖掘最大频繁项集的研究。给出了关联规则和相关术语的基本概念,对最大频繁项集挖掘算法作了分析与评价,便于研究者对已有的算法进行改进,提出具有更好性能的新算法。关键词:数据挖掘;关联规则;最大频繁项集;算法综述中图分类号:TP311文献标识码:A文章编号:1009-3044(2008)32-1030-02 SurveyofAlgorithmsforMiningMaximalFrequentItemsets CHENChen (JiangsuFinanceandEconomicsProfessionalTechnologyInstitute,Huai'an223003,China) Abstract:Miningassociationrulesisquiteanactivefieldintheresearchofdatamininginrecentyears,,andallfrequentitemsetscanbeeducedfrommaximalfrequentitemsets,,andsimplysurveysthatthealgorithmsofmaxfrequentitemsetsmininganditsincrementalminingtoprovideabasisforforimprovingoldalgorithmsordevelopingneweffectiveones. Keywords:datamining;associationrules;maximalfrequentitemset;algorithmssurvey 1引言数据挖掘技术是近年来国内外迅速发展起来的一门交叉学科,被认为是网络技术之后的下一个信息技术热点。数据挖掘又称数据库中的知识发现,是指从大量数据中发现有效的、新颖的、具有潜在作用的、能被用户理解的模式的处理过程。[1],近年来受到了数据库界的广泛关注。关联规则挖掘是寻找在同一个事件中出现的不同项的相关性,即找出事件中频繁发生的项或属性的所有子集,以及它们之间应用相互关联性。关联规则最早用于发现顾客交易数据库中不同商品间的联系,后来诸多的研究人员对关联规则的挖掘问题进行了大量的拓展和研究。关联规则的挖掘一般可分成两个步骤:1)找出所有支持度大于等于最小支持度阈值的频繁项集FI(FrequentI
最大频繁项集挖掘算法综述 来自淘豆网m.daumloan.com转载请标明出处.