商业自动化
主讲教师:陈冬林
第十四讲 DM之关联规则昆明理工大学计算机系周海河*
汛枯蕉肉铲末淀扁空枣蔑予蓬饲疚斥炉寨埂类米退世孔畴拜情盯架匆拼钾专题BI关联规则专题BI关联规则
1
引言
关联规则挖掘
从交易数据库中挖掘一维的布尔形关联规则
练习题
Frequent-Pattern tree(选讲)
目录
悉近戒痒蔬感恬贺涛佐墅射胯兑傀锥袍批裸枫兢挑征泽晦斟秽妙磊秦沤培专题BI关联规则专题BI关联规则
2
引言
关联知识(Association)
一、定义:它反映一个事件和其他事件之间依赖或关联的知识。
二、实现技术有
Apriori算法
第一步是迭代识别所有的频繁项目集,要求频繁项目集的支持率不低于用户设定的最低值;
第二步是从频繁项目集中构造可信度不低于用户设定的最低值的规则。
翌升音履斗瑚词吵联贾率粹佐奄贼春寒丘糖檀捷昧母则碰乘隅等跳左彬潞专题BI关联规则专题BI关联规则
3
关联分析:数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。
逮墅曳盲开鬼砧锋秉猖朽拘氨店狸短返寡蛆敖隶搽木满透缨型滤券轴粹融专题BI关联规则专题BI关联规则
4
关联规则
引言
关联规则挖掘
从交易数据库中挖掘一维的布尔形关联规则
练习题
Frequent-Pattern tree(选讲)
知言厘跳户谣栈畸污箩猫删潦爱肛汰碧纪赁糯旭涨渔黍整半圾倔卵待讨提专题BI关联规则专题BI关联规则
5
什么是关联挖掘?
关联规则挖掘:
在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性、或因果结构。
应用:
购物篮分析、交叉销售、产品目录设计、 loss-leader analysis、聚集、分类等。
举例:
规则形式: “Body ® Head [support, confidence]”.
buys(x, “diapers”) ® buys(x, “beers”) [%, 60%]
major(x, “CS”) ^ takes(x, “DB”) ® grade(x, “A”) [1%, 75%]
藉疤猪莫哺榆捣菱袭犯气要词镑胖梅捣帛筒原瘤蹋插偷城分就慈吟狙县菩专题BI关联规则专题BI关联规则
6
关联规则:基本概念
给定: (1)交易数据库(2)每笔交易是:一个项目列表(消费者一次购买活动中购买的商品)
查找: 所有描述一个项目集合与其他项目集合相关性的规则
., 98% of people who purchase tires and auto accessories also get automotive services done
应用
* 护理用品(商店应该怎样提高护理用品的销售?)
家用电器* (其他商品的库存有什么影响?)
在产品直销中使用附加邮寄
帖件欺掉微剃钦综练振锹躇橙汕毖泻严倾兜霉痒圭塘捍循宠滚好勇援租曳专题BI关联规则专题BI关联规则
7
规则度量:支持度与可信度
查找所有的规则 X & Y Z 具有最小支持度和可信度
支持度, s, 一次交易中包含{X 、 Y 、 Z}的可能性
可信度, c, 包含{X 、 Y}的交易中也包含Z的条件概率
设最小支持度为50%, 最小可信度为 50%, 则可得到
A C (50%, %)
C A (50%, 100%)
买尿布的客户
二者都买的客户
买啤酒的客户
肥炸缀牡芜班蠢规妒酋力摈沟鸯祭哗猖坪啦褂沈自幼褂窗籽尔协溃谚骡陨专题BI关联规则专题BI关联规则
8
关联规则挖掘:路线图
布尔 vs. 定量关联(基于处理数据的类型)
buys(x, “SQLServer”) ^ buys(x, “DMBook”) ® buys(x, “DBMiner”) [%, 60%]
age(x, “30..39”) ^ e(x, “42..48K”) ® buys(x, “PC”) [1%, 75%]
单维 vs. 多维关联(例子同上)
单层 vs. 多层分析
那个品种牌子的啤酒与那个牌子的尿布有关系?
各种扩展
相关性、因果分析
关联并不一定意味着相关或因果
最大模式和闭合相集
添加约束
如, 哪些“小商品”的销售促发了“大商品”的买卖?
屋闽逗仲功修革蹦天旬诀疫摧混哑金镜喝诡表临浇侍袱育玄吻叼晤弦庄物专题BI关联规则专题BI关联规则
9
关联规则
引言
关联规则挖掘
从交易数据库中挖掘一维的布尔形关联
专题BI关联规则 来自淘豆网m.daumloan.com转载请标明出处.