:..P<选项列表>;VAR变量列表;[WEIGHT变量列表;][FREQ变量列表;][PARTIAL变量列表;][BY变量列表;]RUN;DATA=输入数据集,可以是原始数据集,也可以是TYPE=CORR,COV的数据集;OUT=P<选项列表>;VAR变量列表;[WEIGHT变量列表;][FREQ变量列表;][PARTIAL变量列表;][BY变量列表;]RUN;DATA=输入数据集,可以是原始数据集,也可以是TYPE=CORR,COV的数据集;OUT=输出包含原始数据和主成分得分的数据集;OUTSTAT=统计量输出数据集;COVARIANCE|COV要求从协方差阵出发计算主成分,缺省为从相关阵出发计算。N=要计算的主成分个数,缺省时全部计算。STANDARD|STD要求在OUT=的数据集中把主成分得分标准化为单位方差。缺省时主成分得分的方差为相应特征值。PREFIX=主成分名字的前缀,缺省时为PRIN1、PRIN2…。CorrelationMatrix是所有原始指标变量之间的相关系数矩阵如:GDP(x1)与固定资产投资(x3);GDP(x1)与工业总产值(x8);固定资产投资(x3)与工业总产值(x8);居民消费价格指数(x6)与商品零售价格指数(x7);货物周转量(x5)与工业总产值(x8),等等。EigenvaluesofCorrelationMatrix给出了由相关系数矩阵计算出来的全部特征值(Eigenvalue)、相邻两个特征值的差异(difference)、每个主成分的贡献率(proportion)和累积贡献率(cumulative)。如:%,%,%,。%,因此,对第四主成分以后的主成分完全可以忽略不计,用前三个主成分就可以很好地概括这组数据。Eigenvectors输出了全部特征值对应的特征向量,它们是线性无关的单位向量。第1列表示第1主成分Prin1的得分系数,第2列表示第2主成分Prin2的得分系数,以此类推。据此可以写出由标准化变量所表达的各主成分的关系式。x1*=*+*+*+*+*–*–*+*Prin2=*–*+*–*+*+*+*+*Prin3=*+*+*+*–*+*+*+*第一主成分中x3、x1、x8的系数最大,可以把第一主成分看成是由固定资产投资(x3)、GDP(x1)、工业总产值(x8)所刻画的反映经济发展水平的综合指标。Out语句输出的包含原始数据和主成分得分的数据集如:第1个样本(北京)的第一个主成分的得分是
SAS主成分分析示例 来自淘豆网m.daumloan.com转载请标明出处.