下载此文档

大数据挖掘--自行车.doc


文档分类:IT计算机 | 页数:约13页 举报非法文档有奖
1/13
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/13 下载此文档
文档列表 文档介绍
word
word
1 / 13
word
自行车购置预测
随着社会的开展,越来越多的人趋于购置私家车,但又由于油价越来越贵,交通越来越拥挤。更多的人倾向于购置既省钱又环保的自行车。本报告针对给出的案例,运用EXCEL中的数据挖掘Cars可以看出随着拥有的私家车的数量的提高,人们越来越不趋于购置自行车。其次,看以看出一个家庭拥有的孩子数越多越不会购置自行车,收入越高也越趋于不买自行车如如如下图:左边为Cars为1,右边为Cars为4
对于Ine来说,与我们平常的认识不同,收入越高人们越趋向于购置自行车。
对于Children来说,一个家庭拥有的孩子越多,越不趋于购置自行车。
而在现实生活中往往不是单个因素起决定性作用的,往往是多个因素的组合,这就加大了预测的难度,运用神经网络的模型也可以实现多个因素的预测。
word
word
6 / 13
word
总结:对于神经网络模型来说,适用于决策变量的取值只有两个或三个的对象,对于更多的取值利用神经网络模型不可得到。其次,神经网络适用于数据量大的模型的应用,对于小数据量来说,其的准确性会大大降低。
决策树是一种常用于预测模型的算法,它通过将大量数据有目的分类,从中找到一些有价值的,潜在的信息。它的主要优点是描述简单,分类速度快,特别适合大规模的数据处理。最有影响和最早的决策树方法是由quinlan提出的著名的基于信息熵的id3算法。
从数据中生成分类器的一个特别有效的方法是生成一个决策树〔Decision Tree〕。决策树表示方法是应用最广泛的逻辑方法之一,它从一组无次序、无规如此的事例中推理出决策树表示形式的分类规如此。决策树分类方法采用自顶向下的递归方式,在决策树的部结点进展属性值的比拟并根据不同的属性值判断从该结点向下的分支,在决策树的叶结点得到结论。
决策树法的决策过程就是利用了概率论的原理,并且利用一种树形图作为分析工具。其根本原理是用决策点代表决策问题,用方案分枝代表可供选择的方案,用概率分枝代表方案可能出现的各种结果,经过对各种方案在各种结果条件下损益值的计算比拟,为决策者提供决策依据。
管理用的决策树与数据挖掘用的决策树有很大的不同,数据挖掘用的决策树基于从杂乱无章的数据中提取分类在建立联系从而得出结果,而管理用的决策树是一个具体的案例进展方案的选择。
首先选择高级选项中的决策树模型,以Purchased Bike为预测值以其他为输入值得到模型
通过对案例中的数据进展决策树分析,看以看出如下所示:
word
word
7 / 13
word
购不购置自行车与Age和有没有Children存在着依赖关系,其中Age表现出的是强依赖,Children弱依赖。而对于决策树来说
年龄在32~39岁之间的人群各个倾向与购置自行车。
年龄小于32岁或大于39岁的人群来说,孩子小于5个的更倾向于购置自行车。
对于决策树而言,我进展了从原始数据与分类分析进展了比拟,其所给出的依赖关系与决策树得出的结论有所不同,依赖关系中少了Children而多了地区。:
我又通过提取其他模型的关键因素发现地区不是关键的因素,因此决策树所得到的模型结果是比拟准确地。
结论:通过对决策树的分析的得出我们通常认为的收入的上下影响着人们的购置自行车的欲望这个结论是没有依据的,对于销售自行车的公司来说,应该着重针对32~39岁的这些客户群体开展。
聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。 聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxonomy)。聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的根底上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了开展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以与把数据源分类到不同的簇中。
word
word
8 / 13
word
聚类分析能够从样本数据出发,自动进展分类。聚类分析所使用方法的不同,常常会得到不同的结论。
如图下为Purchased Bike 其中的一类
25 <=Age <=37 ,Children=0 ,Occupation=Manual ,
Home Owner=No ,10000 <=Ine <=56255 ,Education=Partial High School ,
Cars=1 ,Marital Status=Sing

大数据挖掘--自行车 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数13
  • 收藏数0 收藏
  • 顶次数0
  • 上传人511709291
  • 文件大小748 KB
  • 时间2022-02-16
最近更新