主成分分析(PCA)袁丁天津大学神经工程与康复实验室./目录TwNE尺什么是PCA一个简单的模型引出的PCAPCA的代数原理今PCA求解总结和讨论今应用领域THNERDPCAPCA(ponentanalysis),主元分析。它是一种对数据进行分析的技术,最重要的应用是对原有数据进行简化。正如它的名字:主元分析,这种方法可以有效的找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。它的优点是简单,而且无参数限制,可以方便的应用与各个场合。目的THNERD压缩变量个数用较少的变量去解释原始数据中的大部分变量,剔除冗余信息。即将许多相关性很高的变量转化成个数较少、能解释大部分原始数据方差且彼此互相独立的几个新变量,也就是所谓的主成分。这样就可以消除原始变量间存在的共线性,克服由此造成的运算不稳定、矩阵病态等问题。THNERD令PCA广泛用于化学实验数据的统计分析,进行数据降维变量提取与压缩、确定化学组分数、分类和聚类以及与其他方法连用进行数据处理令主成分计算方法有非线性偏最小二乘(NIPALS)、乘幂法(POWER)、奇异值分解(SVD)和特征值分解(EVD)等它们的原理基本上是基于特征值问题,计算结果也基本相同一个简单的模型THNERDQuestion大量的变量代表可能变化的因素光谱电压速度实验环不境限制因素复杂、混乱、冗余观测手段HoW分析变量背后的关系?个简单的物理模型这是一个理想弹箦运动规律的测定实验。假设球是连接在个无质量无摩擦的弹簧之上,从平衡位置沿轴拉开一定的距离然后释放。I(a,ya),(xb,yB),(xc,yc)cameraB200HZ沿着某个Xc轴的运动cameraA(x0y0x0)标准正交基200hz拍摄10分钟,将有10X60x200=120000y为行列向量线性无从10…0在线性代数中,这组基本正交基表示关的单位矩阵基变换来Q?如何寻找到另一组正交基,它们是标准正交基的线性组合,而且能够最好的表示数据集?数据被限制在一个向量空间中,能被一组基表假线性隐含的假设了数据之间的连续性关系PX=Y(1)X表示原始数据集。X是一个m*n的矩阵,它的每一个列向量都表示一个时间采样点上的数据X,在上面的例子中,m=6,n=12000Y表示转换以后新的数据集。P是他们之间的线性转换THNERD有如下定义pi表示P的行向量。表示X的列向量(或者X)。yi表示Y的列向量。公式(1)表示不同基之间的转换,在线性代数中它有如下的含义P是从X到Y的转换矩阵几何上来说,P对X进行旋转和拉伸得到Y。P的行向量,{p1,pm)是一组新的基,而Y是原数据X在这组新的基表示下得到的重新表示
主成分分析与应用 来自淘豆网m.daumloan.com转载请标明出处.