第八章
SPSS相关分析与回归分析
1
可编辑ppt
本章内容
相关分析和回归分析概述
相关分析
偏相关分析
线性回归分析
曲线估计
二项Logistic回归分析
2
相关分析和回归分析概述
客观事物之间的关系大致可归纳为两大类,即
函数关系:指两事物之间的一种一一对应的关系,如商品的销售额和销售量之间的关系。
相关关系(统计关系):指两事物之间的一种非一一对应的关系,例如家庭收入和支出、子女身高和父母身高之间的关系等。相关关系又分为线性相关和非线性相关。
相关分析和回归分析都是分析客观事物之间相关关系的数量分析方法。
3
双变量关系强度测量的主要指标
4
相关分析
相关分析通过图形和数值两种方式,有效地揭示事物之间相关关系的强弱程度和形式。
散点图
它将数据以点的的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相关关系及他们的强弱程度和方向。
5
相关系数
利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤:
第一,计算样本相关系数r;
相关系数r的取值在-1~+1之间
R>0表示两变量存在正的线性相关关系;r<0表示两变量存在负的线性相关关系
R=1表示两变量存在完全正相关;r=-1表示两变量存在完全负相关;r=0表示两变量不相关
|r|>; |r|<
第二,对样本来自的两总体是否存在显著的线性关系进行推断。
6
对不同类型的变量应采用不同的相关系数来度量,常用的相关系数主要有Pearson简单相关系数、Spearman等级相关系数和Kendall 相关系数等。
Pearson简单相关系数(适用于两个变量都是数值型的数据)
Pearson简单相关系数的检验统计量为:
7
Spearman等级相关系数
Spearman等级相关系数用来度量定序变量间的线性相关关系,设计思想与Pearson简单相关系数相同,只是数据为非定距的,故计算时并不直接采用原始数据 ,而是利用数据的秩,用两变量的秩 代替 代入Pearson简单相关系数计算公式中,于是其中的 和 的取值范围被限制在1和n之间,且可被简化为:
8
如果两变量的正相关性较强,它们秩的变化具有同步性,于是 的值较小,r趋向于1;
如果两变量的正相关性较弱,它们秩的变化不具有同步性,于是 的值较大,r趋向于0;
在小样本下,在零假设成立时, Spearman等级相关系数服从Spearman分布;在大样本下, Spearman等级相关系数的检验统计量为Z统计量,定义为:
Z统计量近似服从标准正态分布。
9
计算相关系数的基本操作
相关分析用于描述两个变量间关系的密切程度,其特点是变量不分主次,被置于同等的地位。
在Analyze的下拉菜单Correlate命令项中有三个相关分析功能子命令Bivariate过程、Partial过程、 Distances过程,分别对应着相关分析、偏相关分析和相似性测度(距离)的三个spss过程。
Bivariate过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。
Partial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的偏相关系数。
Distances过程用于对各样本点之间或各个变量之间进行相似性分析,一般不单独使用,而作为聚类分析和因子分析等的预分析。
10
相关分析和回归分析 (2) 来自淘豆网m.daumloan.com转载请标明出处.