下载此文档

专题BI关联规则.ppt


文档分类:IT计算机 | 页数:约41页 举报非法文档有奖
1/41
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/41 下载此文档
文档列表 文档介绍
商业自动化
主讲教师:陈冬林
第十四讲 DM之关联规则 昆明理工大学计算机系 周海河 2018年6月2日
1
引言
关联规则挖掘
从交易数据库中挖掘一维的布尔形关联规则
练习题
Frequent-Pattern tree(选讲)
目录
2
引言
关联知识(Association)
一、定义:它反映一个事件和其他事件之间依赖或关联的知识。
二、实现技术有
Apriori算法
第一步是迭代识别所有的频繁项目集,要求频繁项目集的支持率不低于用户设定的最低值;
第二步是从频繁项目集中构造可信度不低于用户设定的最低值的规则。
3
关联分析:数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。
4
关联规则
引言
关联规则挖掘
从交易数据库中挖掘一维的布尔形关联规则
练习题
Frequent-Pattern tree(选讲)
5
什么是关联挖掘?
关联规则挖掘:
在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性、或因果结构。
应用:
购物篮分析、交叉销售、产品目录设计、 loss-leader analysis、聚集、分类等。
举例:
规则形式: “Body ® Head [support, confidence]”.
buys(x, “diapers”) ® buys(x, “beers”) [%, 60%]
major(x, “CS”) ^ takes(x, “DB”) ® grade(x, “A”) [1%, 75%]
6
关联规则:基本概念
给定: (1)交易数据库(2)每笔交易是:一个项目列表(消费者一次购买活动中购买的商品)
查找: 所有描述一个项目集合与其他项目集合相关性的规则
., 98% of people who purchase tires and auto accessories also get automotive services done
应用
* 护理用品(商店应该怎样提高护理用品的销售?)
家用电器* (其他商品的库存有什么影响?)
在产品直销中使用附加邮寄
7
规则度量:支持度与可信度
查找所有的规则 X & Y  Z 具有最小支持度和可信度
支持度, s, 一次交易中包含{X 、 Y 、 Z}的可能性
可信度, c, 包含{X 、 Y}的交易中也包含Z的条件概率
设最小支持度为50%, 最小可信度为 50%, 则可得到
A  C (50%, %)
C  A (50%, 100%)
买尿布的客户
二者都买的客户
买啤酒的客户
8
关联规则挖掘:路线图
布尔 vs. 定量关联(基于处理数据的类型)
buys(x, “SQLServer”) ^ buys(x, “DMBook”) ® buys(x, “DBMiner”) [%, 60%]
age(x, “30..39”) ^ e(x, “42..48K”) ® buys(x, “PC”) [1%, 75%]
单维 vs. 多维关联(例子同上)
单层 vs. 多层分析
那个品种牌子的啤酒与那个牌子的尿布有关系?
各种扩展
相关性、因果分析
关联并不一定意味着相关或因果
最大模式和闭合相集
添加约束
如, 哪些“小商品”的销售促发了“大商品”的买卖?
9
关联规则
引言
关联规则挖掘
从交易数据库中挖掘一维的布尔形关联规则
练习题
Frequent-Pattern tree(选讲)
10

专题BI关联规则 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数41
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wyj15108451
  • 文件大小818 KB
  • 时间2018-06-02