第29卷第4期2阅7年8月宜春学院学报(自然科学)」。师目苗Yic卜ununive功1钾(仙扣旧~ce)VoL29,加‘4A咯么刀,一种改进的Apriori算法陈建辉(莆田学院电子信息工程学系,福建莆田351100)摘要;,在三个方面进行了改进:(1)妓繁2一项集生成方法;(2)改进人Priod_脚算法(3):关联规列;Ap‘而算法;组繁项集中圈分类号:门11门91文献标识码:A文童编号:1671一380X(2以刀),v目APdodA犯。(石耘以即路介&扣扣~白月&杯脱己“,堵众脚月爬川,乃“‘.例自y,声呀画尸山翻曰351100)A阮由,d:肪er砌d洲咫耐山介吨阮目即石山口ofAP“,曰Apriori峨,‘山口,.,。t“,R舰仪油叩既恤Pm,e~t泣血th,.p沈.:(1)‘e此旅业山。山试触甲eOtZ一亩协口咄;(2)1哪~助对。七脚确,亩b.;(3),丁、ee平ri价皿阮e龙伴n~“th口坛日沙e压。e以孚取y,on卜:州汉沁妇石叨司e日;Apri耐目,山卜m;,关联规则挖掘试图从一组给定的数据项以及事务数据库(每个事务是一个数据项的集合),,可以分解成两个子问题:(1)找出事务数据库D中所有大于等于用户指定最小支持度的项目集,即频萦项目集;(2)。这些算法产生频景项目集时,扫描数据库的每个事务,确定最小支持,在第k次迭代出所有频萦项目集,然而,由于数据库的规则通常是非常大的,所以在每次迭代时产生候选项目集以统计其支持度是非常耗时的。,最著名的是灰户侧目等人川于1993年提出的Apriod算法彻d硕算法基于这样的事实:,k一项集用于(k+1):首先遍历目标数据库一次,记录每个项目或属性的出现次数,即计算每个项目的支持度,收集所有支持度不低于用户最小支持度的项目构成频萦1一项集L:,然后链接L:中所有的元素对形成候选2-项集几,再次遍历事务数据库,计算C:中每个候选2一项集的支持度,收集所有支持度不低于用户最小支持度的项目构成频紧2一项集乌,再链接乌形成C,,,算法描述如下:输入:
一种改进的Apriori算法.pdf 来自淘豆网m.daumloan.com转载请标明出处.