下载此文档

关联规则挖掘举例.ppt


文档分类:IT计算机 | 页数:约16页 举报非法文档有奖
1/16
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/16 下载此文档
文档列表 文档介绍
该【关联规则挖掘举例 】是由【ielbcztwz24384】上传分享,文档一共【16】页,该文档可以免费在线阅读,需要了解更多关于【关联规则挖掘举例 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。对于规则 AC:
支持度 = support({A,C }) = 50%
置信度 = support({A,C })/support({A})
= %
假设最小值支持度为50%,最小置信度为50%
规则AC满足最小支持度和最小置信度,所以它是强关联规则
关联规则挖掘举例
关联规则挖掘的步骤
大于或者等于最小支持度的项集
点击此处添加小标题
点击此处添加正文,请言简意赅的阐述观点。
点击此处添加小标题
点击此处添加正文,请言简意赅的阐述观点。
Apriori算法
Apriori算法是一种经典的生成布尔型关联规则的频繁项集挖掘算法。
Apriori算法将发现关联规则的过程分为两个步骤:
通过迭代,检索出事务数据库中的所有频繁项集,即支持度不低于用户设定的阈值的项集;
利用频繁项集构造出满足用户最小置信度的规则。
挖掘或识别出所有频繁项集是该算法的核心,占整个计算量的大部分。
Apriori算法的重要性质
性质1:频繁项集的子集必为频繁项集
性质2:非频繁项集的超集一定是非频繁的
假设项集{A,C}是频繁项集,则{A}和{C}也为频繁项集
假设项集{D}不是频繁项集,则{A,D}和{C,D}也不是频繁项集
现有A、B、C、D、E五种商品的交易记录表,找出所有频繁项集,假设最小支持度>=50%,最小置信度>=50%
Apriori算法举例
K=1
支持度<50
K=2
支持度<50
支持度<50
Apriori算法举例_产生频繁项集
支持度<50
支持度<50
Apriori算法举例_产生频繁项集
对于频繁项集{B,C,E},它的非空子集有{B}、{C}、{E}、{B,C}、{B,E}、{C,E}。以下就是据此获得的关联规则及其置信度。
规则
置信度Confidence
BCE
%
CBE
%
EBC
%
CEB
1
BEC
%
BCE
1
置信度≥50%(最小置信度),
都是强关联规则
Apriori算法举例_产生关联规则
Apriori算法弊端
产生大量频繁集
若有100个项目,可能产生候选项数目
需要多次扫描数据表
如果频繁集最多包含10个项,那么就需要扫描交易数据表10遍,这需要很大的I/O负载
FP-growth算法
Jiawei Han等人在2000年提出了一种基于FP-树的关联规则挖掘算法FP_growth,它采取“分而治之”的策略,将提供频繁项目集的数据库压缩成一棵频繁模式树(FP-树)。
仅两次扫描数据库。
理论和实验表明该算法优于Apriori算法。

关联规则挖掘举例 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数16
  • 收藏数0 收藏
  • 顶次数0
  • 上传人ielbcztwz24384
  • 文件大小1.42 MB
  • 时间2025-02-09
最近更新