下载此文档

最邻近模板匹配法.docx


文档分类:建筑/环境 | 页数:约19页 举报非法文档有奖
1/19
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/19 下载此文档
文档列表 文档介绍
报告提交日期
2013 年 6 月 27
报告批改日期
2013年 月
最邻近模板匹配法
实验内容:
在模式识别中一个最基本的方法, 就是模板匹配法(template matching),它基本上是一种统计识别方后低年级的教学安排中,能早一点多学点相关的软件基础, 平时老师能给我们学生一部分相关的作业作为练习。之后能细致的讲解和辅导。当然,我们自己也应该更 加努力课下阅读学习相关的书籍知识。

杨淑莹,《图像模式识别》,清华大学出版社,2005年第一版
Bayes分类器 最小错误概率的 Bayes方法
.实验目的:
.对模式识别有一个初步的理解,能够根据自己的设计对贝叶斯决策理论算法有一个深刻地 认识;
.理解二类分类器的设计原理。
.实验条件
pc机一台,vs2008软件
.实验原理
.目标:
计算
的I。
分析:
由于数据t是一个新的数据, ‘二/|)无法在训练数据集中统计出来。因此需要转换。根据概率论中
的贝叶斯定理
式用期二
其现5
TO
将”) 的计算转换为:
咐|。二
(1)
其中,表示类G在整个数据空间中的出现概率,可以在训练集中统计出来(即用
G在训练数据
集中出现的频率F(c,来作为概率。但①1卬和Mt)仍然不能统计出来。
首先,对于
网4 CP,它表示在类
中出现数据t的概率。根据“属性独立性假设”
,即对于属于类
g的所有数据,
它们个各属性出现某个值的概率是相互独立的。如,判断一个干部是否是“好干部”(分
类)时,其属性“生活作风=好”的概率(p(生活作风=好好干部))与“工作态度=好”的概率(p(工作 态度=好好干部))是独立的,没有潜在的相互关联。换句话说,一个好干部,其生活作风的好坏与其工作 态度的好坏完全无关。我们知道这并不能反映真实的情况,因而说是一种“假设”。使用该假设来分类的 方法称为“朴素贝叶斯分类”。
c
根据上述假设,类 中出现数据t的概率等于其中出现 t的各属性值的概率的乘积。即:
即卬=np(4c)
(2)
其中,4是数据t的第k个属性值。
其次,对于公式(1)中的汽0,即数据t在整个数据空间中出现的概率,等于它在各分类中出现概率
的总和,即:
汽£)=工小G)

其中,各以4卬的计算就采用公式(2)。
这样,将(2)代入(1),并综合公式(3)后,我们得到:
刑匕AlPUIG)
(4)
.其中:
公式(4)就是我们最终用于判断数据 t分类的方法。其依赖的条件是:从训练数据中统计出
和股)
当我们用这种方法判断一个数据的分类时,用公式( 4)计算它属于各分类的概率,再取其中概率最大
■为分类的结果・
.文本分类的具体方法
文本分类中,数据是指代表一篇文本的一个向量。向量的各维代表一个关键字的权重。训练文本中, 每个数据还附带一个文本的分类编码。对此我们有两个方面的工作:
(1)分类器学习:即从训练数据集中统计
N川夕和邓》并保存起来。(保存到-个数据文件
中,可以再次加载)。在分类器的程序中,需要有表达和保存这些概率数据的变量或对象。
(2)分类识别:从一个测试文档中读取其中的测试数据项,识别他们的分类,并输出到一个文件中。
时会遇到麻烦:新数据的 4
但文本分类有一个特殊情况: 各属性的值不是标准值, 不像“性别”这样的属性。因此在查找电।夕
值可能在训练数据中从未出现过。这个问题的另一方面是:训练数据中各属性
(分别对应一个关键词)的值太分散,几乎不可能出现某个关键词在多篇文章中的权重相同的情况。这样,
珀ICJ
太多、太分散,没有统计上的意义。
这一问题的处理方法是:将各关键词的权重分段:即将权重的值域分成几个段,每段取其中数值的平
均值作为其标准值。第一种方法是,直接对所有训练数据的属性值进行分段,如对第 k个属性,将其值域
分为(0〜), (〜),…,(〜1),各段分别编号为 0,1,…9。一个数据的该属性值为 ,则重设该属性
值为它所处的分段编号,即
k个属性,将其值域分为 (0〜),
另一种方法同样进行分段,但分段后计算各段的平均值作为各段的标准值。根据具体数据相应属性的 值与各分段标准值的接近程度,重新设置数据该属性的值。如对第
(〜),…,(〜1),假设(〜), (〜),而一个数据的该属性值
,则该数据的该属性值与 ,应该重设为 。这就是我们要采用的方法。
下一个问题是,以什么作为分段标准?如果按平

最邻近模板匹配法 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数19
  • 收藏数0 收藏
  • 顶次数0
  • 上传人0640105
  • 文件大小152 KB
  • 时间2022-07-26