数据挖掘第五章 关联挖掘
关联规则挖掘就是从大量的数据中挖掘出有价值描述数据项之间相互联系
的有关知识。随着收集和存储在数据库中的数据规模越来越大,人们对从这些数
据中挖掘相应的关联知识越来越有兴趣。例如:从大量的商业交易记录中发现有
价值的关联知识就可帮助进行商品目录的设计、交叉营销或帮助进行其它有关的
商业决策。
挖掘关联知识的一个典型应用实例就是市场购物分析。根据被放到一个购物
袋的(购物)内容记录数据而发现的不同(被购买)商品之间所存在的关联知识
无疑将会帮助商家分析顾客的购买习惯。如图- 所示。发现常在一起被购买的
商品(关联知识)将帮助商家制定有针对性的市场营销策略。比如:顾客在购买
牛奶时,是否也可能同时购买面包或会购买哪个牌子的面包,显然能够回答这些
问题的有关信息肯定会有效地帮助商家进行有针对性的促销,以及进行合适的货
架商品摆放。如可以将牛奶和面包放在相近的地方或许会促进这两个商品的销
售。
如何从交易记录数据库或关系数据库的大量数据中挖掘出关联规则知识呢
什么样的关联规则才是最有意义的呢如何才能帮助挖掘过程尽快发现有价值的
关联知识呢 本章就将深入讨论这些问题及其相应的解决方法。
挖掘关联规则(知识)就是从给定的数据集中搜索数据项(
)之间所
存在的有价值联系。本节将介绍关联规则挖掘的基本知识;其中: 小节要
介绍对市场购物(袋)相关交易记录数据的分析实例。它是关联规则挖掘的起源;
小节将要介绍关联规则挖掘的一些基本概念;而 小节则要描述能够挖
掘出不同形式关联规则的有关方法。
作为一个商场主管,肯定想要知道商场顾客的购物习惯;尤其是希望了解在
(一次)购物过程中,那些商品会在一起被(顾客所)购买。为帮助回答这一问
题,就需要进行市场购物分析,即对顾客在商场购物交易记录数据进行分析。所
分析的结果将帮助商场主管制定有针对性的市场营销和广告宣传计划,以及编撰
合适的商品目录。比如:市场购物分析结果将帮助商家对商场内商品应如何合理
摆放进行规划设计。其中一种策略就是将常常一起购买的商品摆放在相邻近的位
数据挖掘第五章 关联挖掘
置,以方便顾客同时购买这两件商品;如:如果顾客购买电脑的同时常也会购买
一些金融管理类软件,那么将电脑软件摆放在电脑硬件附近显然将有助于促进这
两种商品的销售;而另一种策略则是将电脑软件与电脑硬件分别摆放在商场的两
端,这就会促使顾客在购买两种商品时,走更多的路从而达到诱导他们购买更多
商品的目的。比如:顾客在决定购买一台昂贵电脑之后,在去购买相应金融管理
软件的路上可能会看到安全系统软件,这时他就有可能购买这一类软件。市场购
物分析可以帮助商场主管确定那些物品可以进行捆绑减价销售,如一个购买电脑
的顾客很有可能购买一个捆绑减价销售的打印机。
牛奶
牛奶面包
鸡蛋糖
果酱黄油...
面包鸡蛋
面包牛奶
糖
顾客 顾客 顾客 顾客
图- 市场购物分析示意描述
若将商场所有销售商品设为一个集合,每个商品( )均为一个取布尔值
(真
假)的变量以描述相应商品是否被(一个)顾客购买。因此每个顾客购物
(袋)就可以用一个布尔向量来表示。分析相应布尔向量就可获得那些商品是在
一起被购买(关联)的购物模式。如顾客购买电脑的同时也会购买金融管理软件
的购物模式就可以用以下的关联规则来描述:
⇒
=
= ()
关联规则的支持度()和信任度(
)是两个度量有关规则
趣味性的方法。它们分别描述了一个被挖掘出的关联规则的有用性和确定性。规
则()的支持度为,就表示所分析的交易记录数据中有交易记录同时
包含电脑和金融管理软件(即在一起被购买)。规则()的信任度则表示
有的顾客在购买电脑的同时还会购买金融管理软件。通常如果一个关联规则
满足最小支持度阈值(
第五章__关联挖掘 来自淘豆网m.daumloan.com转载请标明出处.