下载此文档

自动化科学与技术杨宜民.pptx


文档分类:行业资料 | 页数:约16页 举报非法文档有奖
1/16
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/16 下载此文档
文档列表 文档介绍
该【自动化科学与技术杨宜民 】是由【niuww】上传分享,文档一共【16】页,该文档可以免费在线阅读,需要了解更多关于【自动化科学与技术杨宜民 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。自动化科学与技术
第五章模式识别
杨宜民
研究生示范课程课件
第五章模式识别


模式识别的定义:模式识别又称为模式信息处理,是一门研究用计算机对通常由人类感觉器官接受的图像、图形、表格、文字、语音等的模式信息进行处理、描述和分类的学科。

模式识别是基于统计方法而发展起来的。上世纪60年代,研究者们提出了以贝叶斯(Bayes)决策为基础的特征空间划分的分类器法,以K均值聚类为代表的聚类法和以K-L变换为基础的特征选择法。
上世纪70年代、80年代,虽然句法模式识别和模糊识别方面有了许多新思想,但统计方法依然有生命力。到了90年代,主要研究“统计与句法相结合、句法与语义相结合”的模式识别方法。把语义作为属性引入,形成属性文法,可反映模式属性,通过语义规则降低文法中句法规则的复杂性,则可提高识别率。
利用人工智能中的一些问题求解方法,如知识获取和表达、语义网络与产生式系统、框架和脚本(Script)、数据库和知识库等,正形成一类基于知识的模式识别法。
(计算机视觉)

1982年美国麻省理工学院的马尔(Marr)教授创立了“视觉计算理论”。
马尔视觉计算理论认为,视觉的识别过程分为三个阶段。第一阶段是初始简图(PrimalSketch),其目的是把二维图像中的边界、顶角、交边等重要信息表达清楚;第二阶段是“二维半计算”(),描述出景物的三维可见表面,可称为“早期视觉”;第三阶段是三维景物的恢复与识别,这需要增加约束和利用经验知识。


。图像输入与数字化通常由CCD(ChargeCouplingDevice)摄像头(即机器视觉硬件)来完成。预处理的主要工作是图像的去噪声与信号增强。识别和理解是机器视觉研究中最主要的两大内容。图像识别除需一些算法外,有时还需要经验知识。图像理解主要是靠经验、知识来完成,因此系统中往往要加入知识库。


图像的种类:黑白图像(灰度图像)和彩色图像。
图像分割:指把关注的物体与背景分开来。
几种颜色空间:RBG、XYZ、YIQ、HIS。
颜色空间的转换。

立体视觉指的是从不同位置摄取二幅或二幅以上的图像,并恢复三维信息,即完成三维物体识别、理解。可见,立体视觉可以由二台或者二台以上的CCD所组成,也可以由一台移动的CCD来完成。
立体视觉要解决的问题:
1)抽取二幅图像的特征;
2)寻找二幅图像特征点的对应;
3)可视面的二维半恢复。
图像特征提取常用方法:Kalman滤波法、小波分析法、多尺度法。特征点对应可采用人为标志及内极线法、标记法、松弛法等处理技术。所谓二维半恢复就是根据二幅图对应点来恢复这些可见点、面的三维坐标,有时要用到经验、知识。
在机器人视觉中,摄像机定标指的是摄像机初始位置、方向、光轴中心、尺度因子等未知的参数的确定与校准。目前已提出多种摄像机定标算法。
立体视觉是本学科当前研究热点和方向之一。

移动视觉能获取一系列的动态图像。动态系列图像分析就是通过对运动景物的图像序列分析、研究图像分割、运动参数估计及恢复三维景物的结构参数等。目前常用的是光流法和特征点匹配法。光流法主要通过图像三维速度场恢复三维运动参数及物体结构参数。特征点匹配法主要通过特征点对应求取运动参数和结构参数。
单目移动视觉沿较大曲率半径的曲线方向运动时,获取的动态序列图像可用于立体景物的识别与理解,此时单目移动视觉可以看成立体视觉。但图像三维恢复是不完全的,结构参数和速度矢量中总有一个不能确定的常数因子。此时需要增加附加条件:已知某点的三维坐标或已知物体中一条边长(或增加一台摄像机)。
单目移动视觉沿近似直线方向运动(如高空摄影)时,获取的动态序列图像不能用于景物的立体恢复。此时单目移动视觉的作用是扩大视觉的观察范围。
移动视觉的另一作用是用于动态目标的跟踪。
移动视觉是本学科当前另一研究热点和方向。

自动化科学与技术杨宜民 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数16
  • 收藏数0 收藏
  • 顶次数0
  • 上传人niuww
  • 文件大小138 KB
  • 时间2022-10-27