第4章_主成分分析主成分分析南通大学理学院引言实际问题中,为了尽可能完整的获得相关信息,往往要考虑众多的变量,这虽然避免了主要信息的遗漏,但也存在一定的不足:变量太多会增加计算的复杂性变量太多给分析问题和解释问题带来困难变量提供的信息在一定程度上会有所重叠主成分分析:在不致损失原变量太多信息的条件下,尽可能降低原变量的维数。即用为数较少的互不相关的新变量反映原变量所提供的绝大部分信息。主成分分析即构造原变量的一系列线性组合,使其方差达到最大。总体主成分的定义设为某实际问题所涉及的个随机变量。记随机向量,其协方差矩阵为它是一个阶非负定矩阵。设为维常数向量,考虑如下线性组合:总体主成分易知:我们希望用代替原来个变量,这就要求尽可能地反映原来个变量的信息。这里用方差来度量。即要求达到最大。对任意常数,若取则。总体主成分因此,必须对加以限制,否则无界。最方便的限制是要求具有单位长度,即我们在约束条件之下,求使达到最大,因此所确定的随机变量称为的第一主成分。总体主成分如果第一主成分还不足以反映原变量的信息,进一步求。在约束条件之下求使达到最大。第二主成分:……依次类推得第k主成分注:按上述方法,我们最多可以构造p个方差大于零的主成分!总体主成分的求法设是的协方差矩阵,的特征值及相应的正交单位化特征向量分别为及,则的第个主成分为其中。易见:事实上,令,则为一正交矩阵,且总体主成分的求法设为X的第一主成分,,等号成立。这时总体主成分的求法在约束条件下,当时,达到最大,且设为X的第二主成分,则有即有且
第4章 主成分分析 来自淘豆网m.daumloan.com转载请标明出处.