第十章 SPSS的因子分析
因子分析的提出
为尽可能全面、完整描述一个事物,往往要收集它的许多相关指标,
对高等学校科研状况的评价研究,可能会收集诸如投入科研活动的人年数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标
学生综合评价研究中,可能会收集诸如基础课成绩、学科基础课成绩、专业课成绩等各类课程的成绩以及获得奖学金的次数等
多指标产生的问题:
计算处理麻烦,高维变量和海量数据是不容忽视的问题
变量间的相关性问题,收集到的诸多变量之间通常会存在或多或少的相关性,变量间信息的高度重叠和高度相关会给统计方法的应用带来许多问题。如多重共线性
指标过少产生的问题:
造成信息丢失和信息不全面等问题
因子分析是解决上述问题的一种非常有效的方法。它以最少的信息丢失,将原始众多变量综合成较少的几个综合指标(因子),能够起到有效降维的目的
因子分析的基本出发点
将原始指标综合成较少的综合指标,名为因子。这些指标能够反映原始指标的绝大部分信息(方差)
这些综合指标之间没有相关性
因子变量的特点
因子变量个数远远少于原变量个数,是原变量的重造
因子变量可反映原变量的绝大部分信息
因子变量间不相关性。解决共线性问题
因子可命名解释性。有助于对因子分析结果的解释评价
因子分析的数学模型
因子分析的核心是用较少的互相独立的因子反映原有变量的绝大部分信息。
数学模型(xi为标准化的原始变量,fi为因子变量;k<p)
也可以矩阵的形式表示为:X=AF+ε
aij是第i个原有变量在第j个因子上的负荷。如果把变量xi看成k维因子空间中的一个向量,则aij表示xi在坐标轴j上的投影,相当于多元线性回归模型中的标准化回归系数。
f:因子变量
A:因子载荷阵
aij: 因子载荷
ε: 特殊因子
因子分析的相关概念
因子载荷
在因子变量不相关的条件下,aij就是第i个原始变量与第j个因子变量的相关系数,反映了变量xi与因子fj的相关程度。aij绝对值越大,则xi与fi的相关性越强。同时因子载荷aij也反映了因子fj对解释变量xij的重要作用和程度。
munality)
也称变量方差。xi的变量共同度为因子载荷矩阵A中第i行元素的平方和
在变量xi标准化时,由于变量xi的方差可以表示成,因此原有变量xi的方差可分解释为变量共同度和特殊因子的平方
因子分析的相关概念
第一部分为变量共同度反应了全部因子变量对原有变量xi总方差解释说明的比例,体现了因子全体对原有变量xi的解释贡献程度。可见, 越接近1,说明因子全体己经解释说明了原有变量xi的几乎全部信息;
第二部分是特殊因子: 它反应了原有变量方差中无法被因子全体刻画的比例
可见:xi的共同度反映了全部因子变量对xi总方差的解释的程度,是评价变量xi信息丢失程度的重要指标。,则说明提取出的公共因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。
因子分析的相关概念
因子fj的方差贡献
因子变量fj的方差贡献为因子载荷矩阵A中第j列各元素的平方和
因子变量fj的方差贡献体现了同一因子fj对原始所有变量总方差的解释能力,该值越高,说明相应因子的重要性越高。因此,因子的方差贡献和方差贡献率是衡量因子重要性的关键指标。
表示了第j个因子解释原所有变量总方差的比例
初始变量经标准化,方差为1,总方差为p
因子分析的基本步骤
因子分析的前提条件,通过各种方法分析原有变量是否存在相关关系,确认待分析的原始变量是否适合作因子分析。
提取因子变量,研究如何在样本数据的基础上提取和综合成少数几个因子。
使因子具有命名解释性,利用旋转方法使因子变量实际含义清晰,使因子具有命名解释性。
计算每个样本的因子变量得分,通过各种方法计算各样本在各因子上的得分,以便在进一步的分析中用较少的因子代替原有变量参与数据建模。
因子分析的前提条件
因子分析的目的,是从原有众多的变量中综合出少量具有代表意义的因子变量,这必定有一个潜在的前提要求,即原有变量之间应具有较强的相关关系。
如果原有变量之间不存在较强的相关关系,那么根本无法从中综合出能够反映某些变量共同特性的几个较少的公共因子变量来。因此,一般在因子分析时,需要对原有变量进行相关分析。
方法
相关系数检验
反映像相关矩阵检验
巴特利特球度检验
KMO检验
相关系数检验
计算原有变量之间的相关系数矩阵并进行统计检验
观察变量的相关系数矩阵,,那么,这些变量就不适合作因子分析
第十章 SPSS的因子分析 来自淘豆网m.daumloan.com转载请标明出处.