下载此文档

关联分析--SPSS例析.doc


文档分类:IT计算机 | 页数:约11页 举报非法文档有奖
1/11
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/11 下载此文档
文档列表 文档介绍
关联分析(笔记)事物之间的关联关系包括:简单关联关系、序列关联关系。简单关联规则:属于无指导学习方法,不直接用于分类预测,只揭示事物内部的结构。Spssmodeler提供了APriori、GRI、Carma等经典算法。APriori和Carma属于同类算法。序列关联:关联具有前后顺序,通常与时间有关。SPSSModeler提供了sequence算法;数据格式如下:按照事务表存储,同事需要时间变量。简单关联规则要分析的对象是事务事务的储存方式有事务表和事实表两种方式。事务表顾客ID项集1A1D2B2D3A3C  事实表顾客ID项目A项目B项目C项目D1100**********     两种表均表明,顾客1购买了AD两种物品,顾客2购买了BD两种物品,顾客三购买了AC两种物品。关联规则有效性的测度指标1、支持度support:所有购买记录中,A、B同时被购买的比例。2、置信度confidence:在购买A的事务中,购买B的比例。关联规则实用性的测度指标1、提升度lift:(在购买A的事务中,购买B的比例)/(所有事务中,购买B的比例)2、置信差3、置信率、正态卡方、信息差等等简单关联关系实例例1数据格式:事实表算法:Apriori所有购买项目均选入前项antecedent和后项consequent。输出结果的最低支持度是10%;本例设定的划分频繁项集的标准大于最小支持度10%。最小置信度是80%;前项最多项目数:5本例中,三项以上没有超过10%的支持度,所以不能形成三项以上的频繁项集,最大的频繁项集大小是2。结论解释:实例:包含前项beer、cannedveg的样本有167个,%。规则支持度:同时购买beer、cannedveg、%。规则置信度:购买beer、cannedveg的客户中,%的人有购买frozenmeal。规则2下,。例2数据格式:事实表算法:Apriori本例前项选择性别和家乡,旨在不同性别和地区客户的购买行为是否存在频繁项集。由于AGE是数据类型变量,所以前项不能选入AGE,可在GRI算法中选入AGE。Sex=M序列关联规则实例例1数据格式:事务表时间变量:time算法:sequence饮料=》啤酒:%,规则置信度100%。饮料=》香肠:规则支持度50%,规则置信度75%。啤酒=》香肠:规则支持度50%,规则置信度60%。将最下置信度调整为30%,结果为:例2本例是客访问网页的数据,包括浏览的内容和顺序等信息。模型旨在发现各类网页的浏览是否存在某种序列关系。Customerguide:客户ID URKcategory:网页浏览内容sequenceID:浏览顺序,即时间顺序。Flight=》hotel,表示浏览航班网页的网民,%的将浏览宾馆住宿的网页,%,%。

关联分析--SPSS例析 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数11
  • 收藏数0 收藏
  • 顶次数0
  • 上传人文库旗舰店
  • 文件大小491 KB
  • 时间2019-09-29
最近更新