下载此文档

大数据挖掘--自行车.doc


文档分类:IT计算机 | 页数:约14页 举报非法文档有奖
1/14
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/14 下载此文档
文档列表 文档介绍
word
word
1 / 14
word
自行车购置预测
随着社会的开展,越来越多的人趋于购置私家车,但又由于油价越来越贵,交通越来越拥挤。更多的人倾向于购置既省钱又环保的自行车。本报告针对给出的案例,运用EXCEL中的数据挖掘工具分析影响人们购置自行车的各个因素:如有没有私家车,有没有家庭,收入,所受的教育等。
预测的目的
同过对自行车购置的预测,可以有效的解决自行车生产商对于其市场的定位,适合的人群,以与客户的购置能力有一个很好地把握。可以帮助其更好的出售产品,如同“啤酒与尿布〞一样,可以提高企业的收益率。其次,通过预测,可以改善企业的产业结构,使其更加符合市场的需求。提高企业的竞争力。对于从企业——顾客这整条价值链的提升有很大的帮助。
二.问题的分解
1. 对于案例中的数据中影响人们购置自行车的各个因素单个进展分析,找出最大的影响因素。
2. 对于各个因素建立一个数据模型,预测实例购置自行车的可能性。
3. 对所建立的模型进展测试。
4. 用所建立的模型进展预测。
三.关键技术与工具
聚类分析
决策树模型
EXCEL的数据挖掘工具 神经网络模型
准确性图表
分类矩阵
Microsoft SQL 2008,Microsoft EXCEL2007,SQL2005 数据挖掘外接程序
四.数据挖掘与预测
随着信息技术的高速开展,人们积累的数据量急剧增长,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生开展起来的数据处理技术。其主要任务是关联分析、分类、预测时序模式和偏差分析等。
word
word
3 / 14
word
数据初步处理:将数据分为两个局部一为分析数据〔定型数据与测试数据〕,二为预测数据

由于所要分析的各个因素存在大量的非线性的关系,对于案例中最后的预测数据我们可能从中找到适宜的线性关系来得出结构,而运用神经网络模型可以解决这类非线性的关系。
它的构筑理念是受到生物〔人或其他动物〕神经网络功能的运作启发而产生的。人工神经网络通常是通过一个基于数学统计学类型的学习方法〔Learning Method〕得以优化,所以人工神经网络也是数学统计学方法的一种实际应用。神经网络可以有MP模型和ANN模型。其中ANN模型又分为前馈型网络和反应型网络。
首先我们利用数据挖掘工具中的建模工具——分类。将已经统计好的数据运用随机抽样的方法分为定型数据和测试数据。定性数据用来建立数据模型,测试数据用来测试模型的准确性。〔定型数据492条,测试数据212条〕
〔1〕定型数据
定型数据是指用来建立模型的数据,这些数据是从原始数据中随机抽选出来的。
我们运用建模工具——神经网络,利用定型数据以Purchased Bike为预测值,其他为输入值得到我们所需要的模型。
可以看出决策变量Purchased Bike有两个属性值,其给预测带来了很大的方便,上图我们可以看出其的概率分布是从高到低的,这种效果有助于我们找出其中的关键因素,摒弃其中对预测结果影响小的因素。其次神经网络模型也具体给出了在定型数据中具体的买或不买自行车的具体数字方面我们统计。
word
word
3 / 14
word
〔2〕测试数据。
测试数据是指用来测试模型可行度与可信度的数据,这些数据是从原始数据中随机抽选出来的。
我们利用已经得到的定型数据的模型,用测试数据运用两种工具进展准确性校验。

如如下图:
可以看出红色的线代表定型数据,蓝色的线代表随机的推测。该图表的 X 轴表示用于比拟预测的测试数据集的百分比。给图表的 Y 轴表示预测为指定状态的值的百分比。
%。

如下如图:
word
word
4 / 14
word
%,%,可以看出所建立的模型的准确度超过50%。同时上图也具体给出了买车,与不买车的正确的概率。
由于以上的定型数据和测试数据都是从统计的数据中随机抽取的,所以其所建立的模型的客观性与准确性无法有较大的保证。因此我又对以上的步骤重复几次。
〔3〕对未知数据的预测。
根据以上得出的比拟准确的定型数据的模型,我们可以利用关联分析模型或决策树模型中得到的主要因素作为输入值,通过添加多个因素对未知数据进展预测。这样预测的结果比拟准确,可信度高。
〔4〕单个因素对于是否够买自行车的影响
运用神经网络得出的模型通过改变因素如Cars可以看出随着拥有的私家车的数量的提高,人们越来越不趋于购置自行车。其次,看以看出一个家庭拥有的孩子数越多越不会购置

大数据挖掘--自行车 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数14
  • 收藏数0 收藏
  • 顶次数0
  • 上传人cxmckate6
  • 文件大小755 KB
  • 时间2021-12-07
最近更新