下载此文档

PCA分析方法.doc


文档分类:高等教育 | 页数:约19页 举报非法文档有奖
1/19
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/19 下载此文档
文档列表 文档介绍
主元阐发(PCA)理论阐发及应用(主要基于外文教程翻译)什么是PCA?ponentanalysis的缩写,中文翻译为主元阐发。它是一种对数据进行阐发的技能,最重要的应用是对原有数据进行简化。正如它的名字:主元阐发,这种要领可以有效的找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的庞大数据降维,揭示隐藏在庞大数据背后的简单结构。它的优点是简单,并且无参数限制,可以方便的应用与各个场合。因此应用极其遍及,从神经科学到盘算机图形学都有它的用武之地。被誉为应用线形代数最代价的结果之一。在以下的章节中,不但有对PCA的比力直观的解释,同时也配有较为深入的阐发。首先将从一个简单的例子开始说明PCA应用的场合以及想法的由来,进行一个比力直观的解释;然后参加数学的严格推导,引入线形代数,进行问题的求解。随后将揭示PCA与SVD(position)之间的联系以及如何将之应用于真实世界。最后将阐发PCA理论模型的假设条件以及针对这些条件可能进行的改造。一个简单的模型在实验科学中我常遇到的情况是,使用大量的变量代表可能变革的因素,例如光谱、电压、速度等等。但是由于实验情况和视察手段的限制,实验数据往往变得极其的庞大、杂乱和冗余的。如何对数据进行阐发,取得隐藏在数据背后的变量干系,是一个很困难的问题。在神经科学、气象学、海洋学等等学科实验中,假设的变量个数可能非常之多,但是真正的影响因素以及它们之间的干系可能又是非常之简单的。下面的模型取自一个物理学中的实验。它看上去比力简单,但足以说明问题。如Error!。这是一个理想弹簧运动规律的测定实验。假设球是连接在一个无质量无摩擦的弹簧之上,从平衡位置沿轴拉开一定的距离然后释放。对付一个具有先验知识的实验者来说,这个实验是非常容易的。球的运动只是在x轴向上产生,只需要记录下x轴向上的运动序列并加以阐发即可。但是,在真实世界中,对付第一次实验的探索者来说(这也是实验科学中最常遇到的一种情况),是不可能进行这样的假设的。那么,一般来说,必须记录下球的三维位置。这一点可以通过在差别角度安排三个摄像机实现(如图所示),假设以的频率拍摄画面,就可以得到球在空间中的运动序列。但是,由于实验的限制,这三台摄像机的角度可能比力任意,并不是正交的。事实上,在真实世界中也并没有所谓的轴,每个摄像机记录下的都是一幅二维的图像,有其自己的空间坐标系,球的空间位置是由一组二维坐标记录的:。经过实验,系统产生了几分钟内球的位置序列。怎样从这些数据中得到球是沿着某个x轴运动的规律呢?怎样将实验数据中的冗余变量剔除,化归到这个潜在的x轴上呢?这是一个真实的实验场景,数据的噪音是必须面对的因素。在这个实验中噪音可能来自空气、摩擦、摄像机的误差以及非理想化的弹簧等等。噪音使数据变得杂乱,掩盖了变量间的真实干系。如何去除噪音是实验者每天所要面对的巨大考验。上面提出的两个问题就是PCA要领的目标。PCA主元阐发要领是解决此类问题的一个有力的武器。下文将结合以上的例子提出解决方案,逐步叙述PCA要领的思想和求解历程。线形代数:基变更从线形代数的角度来看,PCA的目标就是使用另一组基去重新描述得到的数据空间。而新的基要能尽量揭示原有的数据间的干系。在这个例子中,沿着某轴上的运动是最重要的。这个维度即最重要的“主元”。PCA的目标就是找到这样的“主元”,最洪流平的去除冗余和噪音的滋扰。,需要将上文的数据进行明确的界说。在上面描述的实验历程中,在每一个采样时间点上,每个摄像机记录了一组二维坐标,综合三台摄像机数据,在每一个时间点上得到的位置数据对应于一个六维列向量。

PCA分析方法 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数19
  • 收藏数0 收藏
  • 顶次数0
  • 上传人465784244
  • 文件大小876 KB
  • 时间2020-07-18
最近更新