主成分分析算法的研究报告人:周卫林 1背景 8应用 4几何意义 2提出主成分分析算法 3原理 5数学描述 6数学推导 7计算步骤 9程序演示主成分分析算法的背景指标在实际工程领域的研究中,为了全面、系统地分析问题,我们必须考虑众多的影响因素。在多元统计分析中也称为变量。主成分分析算法的背景每个变量都在不同程度上反映了所研究问题的某些信息,并且变量之间彼此有一定的相关性,因而使得统计后的数据反映的信息在一定程度上存在重叠。主成分分析算法的产生原因主成分分析算法的背景在用统计方法研究多变量问题时,变量太多会大大增加计算量和问题的复杂度, 会耗费很多硬件、网络资源,所以人们希望在进行定量分析的过程中,通过较少的变量得到较多的信息量。主成分分析算法的产生原因主成分分析算法的提出主成分分析(Principal Component Analysis) 首先是由 在 1901 年的生物学理论研究中引入的; 之后 将此方法推广到心理学中随机向量的情形,使主成分分析得到进一步发展; 1947 年, Karhunen 独立地用概率论的形式再次描述了主成分分析算法; 其后, Loe ’ve 将该理论进一步扩充和完善。因此主成分分析也有其它名称,又叫做 KLT(Karhunen 一 Loeve Transform) 或者 Hotelling 变换。卡尔皮尔逊( Karl Prarson,1857- 1936 ),英国生物学家和统计学家。他是现代统计学的奠基人之一, 他的主要成就和贡献是在统计学方面。他开始把数学运用于遗传和进化的随机过程,首创次数分布表与次数分布图,提出一系列次数曲线;推导出卡方分布,提出卡方检验,用以检验观察值与期望值之间的差异显著性;发展了回归和相关理论;为大样本理论奠定了基础。皮尔逊的科学道路,是从数学研究开始,继之以哲学和法律学,进而研究生物学与遗传学,集大成于统计学。卡尔皮尔逊( Karl Prarson,1857- 1936 ),英国生物学家和统计学家。他是现代统计学的奠基人之一, 他的主要成就和贡献是在统计学方面。他开始把数学运用于遗传和进化的随机过程,首创次数分布表与次数分布图,提出一系列次数曲线;推导出卡方分布,提出卡方检验,用以检验观察值与期望值之间的差异显著性;发展了回归和相关理论;为大样本理论奠定了基础。皮尔逊的科学道路,是从数学研究开始,继之以哲学和法律学,进而研究生物学与遗传学,集大成于统计学。主成分分析算法的原理以某些线性组合来表示原始数据,再从这些线性组合中尽可能快地提取原始数据的信息。当第一个线性组合不能提取更多的信息时,再考虑用第二或更多的线性组合继续快速提取数据信息……直到所提取的信息与原始数据包含的信息相差不多或者满足用户精度要求。这些线性组合依次被称为第一主成分(主分量)、第二主成分(主分量)……主成分分析在二维空间的几何意义主成分分析在二维空间的几何意义相当于坐标旋坐标旋转转。。
主成分分析算法解析 来自淘豆网m.daumloan.com转载请标明出处.