主成分分析在提取多光谱数据的特征
光谱成像技术就是利用多个光谱通道进行图像采集、显示、处理和分析解释的技术。
探测器按照波长的方向采集数据可以得到光谱序列,即光谱立方体。光谱立方体是多光谱图像按照按照波长方向组织成的图像集,得到得是光谱信息与图像信息的综合数据
图像立方体拥有庞大的数据量,数据处理起来十分的不方便且计算速度会很慢,观察图像立方体可知其层与层之间的数据相关性很强,我们可以通过对图像立方体做线性变换消除层与层之间得相关性,且可以保留完整的图像特征。
主成分分析是一种简化数据集的技术,它首先度量数据之间的相关度来衡量数据冗余,其目的是寻找变量的冗余度更小的一个子集,在去除数据冗余的同时获得数据的最大特征。具体方法是将数据线性变换到一个新的坐标系中,使得任何数据投影的第一大方差在第一个坐标系上,第二大方差在第二个坐标系上,以此类推。主成分分析可以降低数据集尾数的同时,保持数据集对方差贡献的最大特征。
概念解释:相关度、图像特征、线性变换过程
设一个光谱立方体共有p副配准图像,则任一个像素i的光谱值可以表示成向量的形式: 。若每一副图像的大小为M*N,则包含若有像素的p维向量共有MN个。
我们把 作为随机变量处理, 取完是一张图片上的所有值,
是随机向量包含了图像立方体的所有值
相关性是指随机变量 与 之间的相关性,它以协方差 cov( , ) 度量相关程度,图像立方体总图片之间相关性是以协方差的大小确定得。
图像特征是用随机变量的方差度量得,方差越大图像上的灰度值上下波动得幅度越大,图像变现得明显,图像特征越大。
线性变换过程举个简单的例子随机向量X=( , )做线性变换得到M=( y,z ),其中线性变换矩阵是A,公式为M=A*X,其中A为
M=A*X为
*
=
得:
假设 和 是光谱立方体上两张图片灰度值的随机变量,它的图像如下图1,从图中可以看出图形的两个坐标轴并不是理想的,没有携带最大量信息。使用主成分分析的目的就是平移转动坐标轴到原始散点图的中心位置,是原始随机变量投影到一组新的坐标轴上。如图2显示,原始坐标轴围绕原点旋转一定的角度得到随机变量 y 和z,是两者方差最大化。
图1
图2
主成分分析算法过程
协方差(covariance)
方差
标准差
基本概念
协方差矩阵
主成分分析的步骤
(1)将原始数据标准化(目的是消除不同量纲、正逆指标的影响)
设原始数据矩阵为
按下式进行标准化(其中Y为标准化后的数据)
(2)计算相关系数矩阵R
(3)求相关系数矩阵的特征根及对应的特征向量
(4)写出主成分
(一) 第一主成分
二、主成分的推导
设X的协方差阵为
主成分分析 来自淘豆网m.daumloan.com转载请标明出处.