模式识别支持向量机课件
现在学习的是第1页,共26页
内容
SVM的理论基础
线性判别函数和判别面
最优分类面
支持向量机
现在学习的是第2页,共26页
SVM的理论基础
传统的统计模式识别方法只有在样本趋向无穷大时它把归类于C1的点与归类于C2的点分开来。
当g(x)是线性函数时,这个平面被称为“超平面”(hyperplane)。
当x1和x2都在判定面上时,
这表明w和超平面上任意向量正交,
并称w为超平面的法向量。
超平面
现在学习的是第8页,共26页
线性判别函数和判别面
判别函数g(x)是特征空间中某点x到超平面的距离的一种代数度量.
现在学习的是第9页,共26页
线性判别函数和判别面
广义线性判别函数
在一维空间中,没有任何一个线性函数能解决下述划分问题(黑红各代表一类数据),可见线性判别函数有一定的局限性。
现在学习的是第10页,共26页
线性判别函数和判别面
广义线性判别函数
如果建立一个二次判别函数g(x)=(x-a)(x-b),则可以很好的解决上述分类问题。
决策规则仍是:如果g(x)>=0,则判定x属于C1,如果g(x)<0,则判定x属于C2。
现在学习的是第11页,共26页
线性判别函数和判别面
现在学习的是第12页,共26页
线性判别函数和判别面
广义线性判别函数
现在学习的是第13页,共26页
最优分类面
SVM 是从线性可分情况下的最优分类面发展而来的, 基本思想可用下图的两维情况说明.
图中, 方形点和圆形点代表两类样本, H 为分类线,H1, H2分别为过各类中离分类线最近的样本且平行于分类线的直线, 它们之间的距离叫做分类间隔(margin)。
所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大.
推广到高维空间,最优分类线就变为最优分类面。
现在学习的是第14页,共26页
最优分类面
设线性可分的样本集:
D维空间中的线性判别函数:
这样分类间隔就等于 ,因此要求分类间隔最大,就要求 ,就是要求满足
现在学习的是第15页,共26页
最优分类面
求最优分类面(最大间隔法)
已知:
求解:
目标:最优分类面
这是一个二次凸规划问题,由于目标函数和约束条件都是凸的,根据最优化理论,这一问题存在唯一全局最小解.
原问题
现在学习的是第16页,共26页
最优分类面
凸集和凸函数
凸函数的极小:
若问题有局部解,则这个局部解是整体解.
现在学习的是第17页,共26页
最优分类面
首先建立Lagrange函数
最终可得到
对偶问题
现在学习的是第18页,共26页
最优分类面
线性不可分的情况下,可以条件
中增加一个松弛项 成为
已知:
求解:
目标:最优分类面
折衷考虑最少错分样本和最大分类间隔,就得到广义最优分类面,其中,C>0是一个常数,它控制对错分样本惩罚的程度。
现在学习的是第19页,共26页
支持向量机
上节所得到的最优分类函数为:
该式只包含待分类样本与训练样本中的支持向量的内积 运算,可见,要解决一个特征空间中的最优线性分类问题,我们只需要知道这个空间中的内积运算即可。
对非线性问题, 可以通过非线性变换转化为某个高维空间中的线性问题, 在变换空间求最优分类面. 这种变换可能比较复杂, 因此这种思路在一般情况下不易实现.
现在学习的是第20页,共26页
支持向量机
核:
现在学习的是第21页,共26页
支持向量机
现在学习的是第22页,共26页
支持向量机
核函数的选择
现在学习的是第23页,共26页
支持向量机
SVM方法的特点
① 非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射;
② 对特征空间划分的最优超平面是SVM的目标,最大化分类边界的思想是SVM方法的核心;
③ 支持向量是SVM的训练结果,在SVM分类决策中起决定作用的是支持向量。
SVM 是一种有坚实理论基础的新颖的小样本学习方法。它基本上不涉及概率测度及大数定律等,因此不同于现有的统计方法。从本质上看,它避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预报样本的“转导推理”(transductive inference) ,大大简化了通常的分类和回归等问题。
现在学习的是第24页,共26页
支持向量机
SVM方法的特点
SVM 的最终决策函数只由少数的支持向量所确定,计算的复杂性取决
模式识别支持向量机课件 来自淘豆网m.daumloan.com转载请标明出处.