matlab 实现 apriori 算法源代码一、实验目的通过实验, 加深数据挖掘中一个重要方法——关联分析的认识, 其经典算法为 aprior i 算法, 了解影响 apriori 算法性能的因素, 掌握基于 apriori 算法理论的关联分析的原理和方法。二、实验内容对一数据集用 apriori 算法做关联分析,用 matlab 实现。三、方法手段关联规则挖掘的一个典型例子是购物篮分析。市场分析员要从大量的数据中发现顾客放入其购物篮中的不同商品之间的关系。如果顾客买牛奶, 他也购买面包的可能性有多大? 什么商品组或集合顾客多半会在一次购物时同时购买?例如, 买牛奶的顾客有 80% 也同时买面包,或买铁锤的顾客中有 70% 的人同时也买铁钉,这就是从购物篮数据中提取的关联规则。分析结果可以帮助经理设计不同的商店布局。一种策略是: 经常一块购买的商品可以放近一些, 以便进一步刺激这些商品一起销售, 例如, 如果顾客购买计算机又倾向于同时购买财务软件,那么将硬件摆放离软件陈列近一点,可能有助于增加两者的销售。另一种策略是:将硬件和软件放在商店的两端,可能诱发购买这些商品的顾客一路挑选其他商品。关联规则是描述数据库中数据项之间存在的潜在关系的规则, 形式为 1 2 1 2 ... ... m n A A A B B B ? ??????, 其中( 1, 2..., ) i A i m ?, ( 1, 2..., ) j A j n ?是数据库中的数据项. 数据项之间的关联规则即根据一个事务中某些项的出现, 可推导出另一些项在同一事务中也出现。四、 Apriori 算法 1. 算法描述 Apriori 算法的第一步是简单统计所有含一个元素的项集出现的频率, 来决定最大的一维项目集。在第 k步, 分两个阶段, 首先用一函数 sc_candidate ( 候选), 通过第(k-1) 步中生成的最大项目集 L k-1 来生成侯选项目集 C k。然后搜索数据库计算侯选项目集 C k C k 中项目的支持度, 文中使用函数 count_support 计算支持度。 Apriori 算法描述如下: (1) C 1 ={candidate1-itemsets}; (2) L 1 ={c ∈C 1 | ≥ minsupport}; (3) f or(k=2,L k-1 ≠Φ,k++) // 直到不能再生成最大项目集为止(4) C k =sc_candidate(L k-1 ); // 生成含 k 个元素的侯选项目集(5) for all transactions t∈D // 办理处理(6) Ct=count_support(C k ,t); // 包含在事务 t 中的侯选项目集(7) for all candidates c∈C t (8) =+1; (9) next (10) L k ={c ∈C k | ≥ minsupport}; (11) next (12) resultset=resultset ∪L k 其中,D 表示数据库; minsupport 表示给定的最小支持度; res
matlab实现apriori算法源代码 来自淘豆网m.daumloan.com转载请标明出处.