主成分分析
实验1:数据Employee -1971年之间雇员情况的数据,共包括474条观测及如下10各变量:本例中需要用到的变量分别为
Educ ,Salary,Salbegin,Jobtime,Orevexp。
下面我们用主成分分析法处理该数据,一起用少数变量来描述该地区居民的雇佣情况。
打开数据Employee ,依次选分析——降维——因子分析
点击OK即可,输出为:
公因子方差给出了该次分析从每个原始变量中提取的信息,可看出除受教育程度信息损失较大外,主成分几乎包含了各个原始变量至少90%的信息。
公因子方差
初始
提取
Educational Level (years)
.754
Current Salary
.896
Beginning Salary
.916
Months since Hire
.999
Previous Experience (months)
.968
提取方法:主成份分析。
解释的总方差显示了各主成分解释原始变量总方差的情况,默认保留特征根大于1的主成分,本例保留3个主成分,%,可见效果比较好。
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
2
3
4
.365
5
.102
1
2
3
4
.365
5
.102
提取方法:主成份分析。
实际上,主成分解释总方差的百分比也可以由公因子方差表计算得出,即
(.754+.896+.916+.999+.968)/5=%,
成分矩阵给出了标准化原始变量用求得的主成分线性表示的近似表达式,以current Salary一行为例,用prin1,prin2,prin3来表示个各主成分,得到:
标准化的Salary~*prin1+*prin2+(-02)*prin3.
成份矩阵a
成份
1
2
3
Educational Level (years)
.846
-.194
-.014
Current Salary
.940
.104
主成分分析-实验 来自淘豆网m.daumloan.com转载请标明出处.