学生超市购买商品的关联性分析
前言
“啤酒与尿布”是超市商品布局的一个经典案例,它是说在美国的沃尔玛 超市中,将啤酒和尿布这两个看起来毫不相关的物品摆放在相邻的位置。其原因 就是沃尔玛通过大量的数据分析,发现有非常多的年轻爸爸在购买尿布644241353
1
8
2
51
69004045194
57 ==> 5
1
9
2
43
5 ==>
6907992505268
2
0
2
43
69079925052
68 ==> 5
从表中来看,出现最多的(即支持度最大)的商品组合代码为 21 和 1,它 所代表的商品分别为奶茶(21)和沁园面包(1),共有 102 条记录,支持度为 % ;其次为 6923644223458 和 5 ,它所代表的商品组合为蒙牛纯牛奶 (6923644223458)和奇乐贝尔面包(5),共有92 条记录,%。再 之后分别为纸袋和奇乐贝尔面包、伊利红枣奶和奇乐贝尔面包、伊利纯牛奶和奇 乐贝尔面包等。
同时我们也看到,不存在有规律的三个或者三个以上的商品组合。
我们看到,我们最初设置的支持度 20%偏大,我校学生购买商品较为分散, 并没有特定的组合。为了考察当购买一种商品后所指向的另一种商品的情况,对 上述满足支持度>%的组合按照置信度大小按降序排列。结果如下表 2(只列 出前20 项):
表2
Relati
ons
Lift
Support(
%)
Confide nce(%)
Transaction
Count
Rule
20
2
43
6907992505
268 ==> 5
13
2
59
6923644264
116 ==> 5
15
2
51
6923644241
353 ==> 5
30
2
36
6907992504
476 ==> 5
32
2
34
6923644272
159 ==> 5
18
2
51
6900404519
457 ==> 5
47
2
2
28
6923644268
503 ==> 5
29
2
36
6907992511
146 ==> 5
3
2
91
6923644223
458 ==> 5
35
2
31
6907992511
139 ==> 5
45
2
29
6923644240
318 ==> 5
9
2
62
6907992100
272 ==> 5
24
2
0
数据挖掘课程论文 来自淘豆网m.daumloan.com转载请标明出处.