+a 1i2i pi SPS S 中主成分分析的基本操作 Xiaowenzi22与pink sss共同制作阐述主成分分析法的原理主成分分析是设法将原来众多具有一定相关性(比如 P个指标), 重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P 个指标作线性组合, 作为新的综合指标。最经典的做法就是用 F 1 (选取的第一个线性组合,即第一个综合指标)的方差来表达,即 Var(F 1) 越大,表示 F 1包含的信息越多。因此在所有的线性组合中选取的 F 1应该是方差最打的,故称 F 1 为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取 F 2 即选第二个线性组合, 为了有效地反映原来信息,F 1 已有的信息就不需要再出现再 F 2 中,用数学语言表达就是要求 Cov(F 1,F 2)=0 ,则称 F 2 为第二主成分,依此类推可以构造出第三、第四, ……,第 P个主成分。主成分模型: F 1=a 11X 11+a 21X 21+……+a p1X pF 2=a 12X 12+a 22X 22+……+a p2X p …… F p=a 1mX 11+a 2mX 22+……+a pmX p 其中 a 1i,a 2i,……,a pi(i=1, ……,m) 为X的协差阵Σ的特征值多对应的特征向量, X 1,X 2,……,X p 是原始变量经过标准化处理的值(因为在实际应用中,往往存在指标的量纲不同,所以在计算之前先消除量纲的影响,而将原始数据标准化)。 A=( a ij) p?m=( ? 1,? 2,…,? m), R? i?? i? i,R 为相关系数矩阵, ? i、? i 是相应的特征值和单位特征向量,上述方程组要求: ? 1≥? 2≥…≥? p≥0 1、a 22+……+a 2=1(i=1, ……,m) 2、A ?A?I m(A=( a ij) p?m=( ? 1,? 2,…, ? m),A为正交矩阵) 3、Cov(F i,F j)=? i? ij, ?? 0 ij1 i?ji?j 操作步骤: 一、数据标准化 1、 2 、在弹出对话框中把需标准化的变量选进 Variable 去并在下面的提示前打钩 3 、然后点“ OK” 4 、数据编辑窗内将出现结果二、主成分分析基本操作 1、 2 、选择后弹出现下面的对话框 3、把标准化后的数据都选进 Variables 去 4、点击 5 、弹出现下面的对话框 6、在对话框的空白处填 0,记得上面的图中要选中前面的点 7、点击 continue 钮 8、返回上个对话框 9、如需要得到相关系数矩阵,点击 10、弹出下面的对话框在Coefficients 前的方框打上钩 11、然后点击 continue 钮 12、返回上个对话框,点击“OK” TotalV arianceE xp lained C omponent 12345678 In itial Eig env aluesExtrac tionSumsofSquaredLoadi ngs Total%ofVaria nceCumula tive%Total%ofVaria nceCumula tive% 3. 849 48. 118 48. 1183. 849 48. 118 48. 118 1. 808 22. 594 7
主成分分析操作步骤 来自淘豆网m.daumloan.com转载请标明出处.