SAS主成分分析实例.doc王笑(孝)权 安徽省五河县临北乡石家村卫生室 233316 ******@ 主成分分析又称主分量、 主轴分析, 实质就是对较多的变量在尽量保存原信息的情况下加以线性概括。 在此过程前,为消除变量量纲不同造成的影响,首先要对各原始指标进行标准化处理。迄今为止,所 见教材的 “主成分分析 ”实质都是用求得主成分再对原始变量的回归分析。 教材的通病都是未详细说明 最后的回归过程,往往令初学者感觉到莫名其妙。目前,由网上的一些所谓的 “主成分分析 ”可知,或 者其资料不适用主成分分析,还有根本就不是主成分分析。有鉴于此,现利用网上获得的数据,进行 主成分分析的探讨。
1 资料与方法
资料来源 资料来源于中华人民共和国卫生部网站 [1] ,我国 “ 2006年工业部门职业病发病及死亡 情况”,剔除其中的第 1、2、14 号无意义指标,以及末尾的观测 “其它”,剩余 11个指标,观测值有 缺失则用 0 补齐。程序分别赋这些指标为 x1-x11, 其名称标签见附件 1;余详见数据 1。 数据 1 2006 年工业部门职业病发病及死亡情况相关数据
name
x1
x2
x3
x4
x5
x6
x7 x8
x9
x10
x11
煤炭
4567
212 41
0
34
0
13 0
1 57
0
石油
2
4
1
0
14
0
0
1
0
14
0
电力
110
1
1
0
28
1
0
1
1
16
1
核工业
0
0
0
0
0
0
0
0
0
3
0
冶金
494
65
40
2
159
0
0
3
5
24
11
有色金属
1193
120
38
4
190
11 0
7
2
38
1
333
13
34
1
84
5
0
29
33
50
1
电子
7
0
14
3
120
0
0
51
13
3
0
兵器
7
0
4
0
22
0
0
0 113
6
0
船舶
18
0
1
0
1
1
0
0
0
2
0
化工
103
2
105
3
62
2
0
89
170 24
4
医药
5
0
8
0
15
0
1
19
8
1
0
铁道
64
6
2
0
2
1
0
1
0
4
1
交通
61
1
6
0
14
3
0
6
6
8
0
建材
698
17
6
0
5
1
0
10
3
20
0
建设
126
1
23
8
1
3
0
5
2
3
1
地质矿产
253
3
1
0
4
0
0 1
0
0
0
水利
2
17
0
0
0
0
0
0
0
0
0
农业
23
0
2
0
0
22
5 0
1
0
0
森林工业
2
0
1
SAS主成分分析实例 来自淘豆网m.daumloan.com转载请标明出处.