下载此文档

962-如何选择数据分析方法?.ppt


文档分类:IT计算机 | 页数:约32页 举报非法文档有奖
1/32
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/32 下载此文档
文档列表 文档介绍
如何选择数据分析方法?
吴喜之
1
数据和目的相结合的出发点
1. 相关分析及回归类模型(相关、简单的回归、Logistic回归、对数线性模型、方差分析和一般线性模型)
2. 经典多元分析内容(主成分分析、因子分析、聚类分析、判别分析、对应分析)
2
主要涉及的相关问题
什么是相关?
列联表中定性变量的相关(Fisher & c2检验)
定量变量的相关(Pearson相关系数(r),Kendall’s t、Spearman’ r)
3
基本统计书中的估计和假设检验所涉及的仅仅是对一些互相没有关系的变量的描述。但是现实世界的问题都是相互联系的。不讨论变量之间的关系,就无从谈起任何有深度的应用;而没有应用,前面讲过的那些基本概念就仅仅是摆设而已。
4
变量间的关系
人们每时每刻都在关心事物之间的关系。
比如,职业种类和收入之间的关系、政府投入和经济增长之间的关系、广告投入和经济效益之间的关系、治疗手段和治愈率之间的关系等等。
这些都是二元的关系。
还有更复杂的诸多变量之间的相互关系,
比如企业的固定资产、流动资产、预算分配、管理模式、生产率、债务和利润等诸因素的关系是不能用简单的一些二元关系所描述的。
5
例1广告投入和销售之间的关系()
6
这是什么关系?
这两个变量是否有关系?显然,它们有关系;这从散点图就很容易看出。基本上销售额是随着广告投入的递增而递增。
如果有关系,它们的关系是否显著?这也可以从散点图得到。当广告投入在6万元以下,销售额增长很快;但大于这个投入时,销售额增长就不明显了。因此,这两个变量的关系是由强变弱。
这些关系是什么关系,是否可以用数学模型来描述?本例看上去是可以拟合一个回归模型(后面会介绍),但绝不是线性的(用一条直线可以描述的)。具体细节需要进一步的分析
7
这是什么关系?
这个关系是否带有普遍性?也就是说,仅仅这一个样本有这样的关系,还是对于其他企业也有类似的规律。这里的数据还不足以回答这个问题。可能需要考虑更多的变量和收集更多的数据。一般来说,人们希望能够从一些特殊的样本,得到普遍的结论,以利于预测。
这个关系是不是因果关系?在本问题中,看来似乎有因果关系。这类似于一种试验;而试验时是容易找到因果关系的。但是,一般来说,变量之间有关系但绝不意味着存在因果关系。这里充满了危险和未知!
8
定性变量间的关系 (关于某项政策调查所得结果:)
观点:赞成
观点:不赞成
低收入
中等收入
高收入
低收入
中等收入
高收入

20
10
5
5
8
10

25
15
7
2
7
9
大致可以看出女性赞成的多,低收入赞成的多(还有吗?)
9
观点:赞成(1)
观点:不赞成(0)
低收入(1)
中等收入(2)
高收入(3)
低收入(1)
中等收入(2)
高收入(3)
男1
20
10
5
5
8
10
女0
25
15
7
2
7
9
10

962-如何选择数据分析方法? 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数32
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小玉儿
  • 文件大小0 KB
  • 时间2012-02-02