谨以此论文献给我的导师和家人⋯⋯一王振
学位论文完成日期:竺二笙二型数字视频中文本的提取方法研究觯指导教师签字:答辩委员会成员签字:
●
学位论文作者签名:弓/衫┳秩掌冢憾嘁籪阹月学位论文作者签名:阢签字日期:洳£。年扩月独创声明学位论文版权使用授权书本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含未获得ⅲ喝缑挥衅渌枰L乇鹕鞯模纠缚煽或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。本学位论文作者完全了解学校有关保留、使用学位论文的规定,并同意以⒀S腥ūA舨⑾蚬矣泄夭棵呕蚧顾徒宦畚牡母从〖痛排蹋市论文被查阅和借阅。⒀?梢越宦畚牡娜ú炕虿糠帜谌荼嗳胗泄厥菘饨屑焖鳎以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权清华大学“中国学术期刊馀贪电子杂志社糜诔霭婧捅嗳隒吨泄J蹲试醋库》,授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ导师签名:签字日期:下事项:·
数字视频中文本的提取方法研究摘要对于视频内容的分析与检索已成为当前视频信息研究领域的一个热点。由于视频中包含的文字信息与视频内容关系密切,可以为视频内容理解与检索提供重要线索,因此如何快速、准确的提取视频中文本信息也就成为一项非常有意义的研究方向。除此以外,视频文本提取技术通过与各种移动数码设备肷阆窕数码相机、⑹只结合,在自动翻译、盲人导航、机器人视觉、智能交通等方面也发挥了越来越大的作用,并逐渐成为了研究人员关注的热点问题。从视频中提取文本信息并不是一件简单的事情,由于视频图像中的文本往往存在于复杂的背景中,同一幅图像中可能含有不同字体、颜色、大小和排列方式的文字,因此对于视频中文本检测、定位和分割具有很大的难度。本文对于视频文本提取框架中的若干关键问题,如文本定位、跟踪、增强以及实际应用挛殴适伦远指睢⒌缆方煌ū晔杜莆淖质侗鹣低开展研究。研究内容主要如下:提出了一种综合灰度形态学和小波多尺度分解与重构算法的文本定位方法。首先结合形态学与小波分析在边缘检测方面的优点,提取出视频帧边缘像素,然后通过“基于密度”的区域增长算法将边缘像素合并成为候选文本区。最后采用基于算法进行特征选择及问接呕姆掷嗥鞫院蜓∥谋厩腥认。本方法有效克服了单独优化特征或单独优化分类器参数的缺陷,取得较好的分类效果。提出一种基于边缘角点与改进嗬胛E卸ㄗ荚虻木仓购拖咝栽硕文本的跟踪算法。首先将边缘算子提取的二值图像经去噪、细化处理后,以提取的边缘角点为特征点集合,用改进的嗬攵攘课E卸ㄗ荚颍ü隳式匹配法跟踪文本区域在相邻视频帧序列中的位置。实验结果显示,点模式匹配的跟踪算法比图像整体像素匹配的算法跟踪精度更高。由于该算法不必对每个视频帧都进行文本定位,从而大大提高了系统效率。在文本跟踪的基础上,用基于多帧融合思想的前景/背景识别算法提取视频文字笔画并作侗稹提出了一种融合视频中的标题字幕信息以及音、视频等多模态信息的新闻故事单元分割方法,并实现了一个新闻故事分割、浏览和检索的原型系统。首先根
据第二、三章的算法实现对新闻标题文本的定位、跟踪与分割,并在镜头分割的基础上,根据混合高斯模型隟钜旆ㄍ瓿刹ヒ粼焙头遣ヒ粼币羝稻低的识别,最后结合新闻视频节目的特殊结构知识完成对新闻节目故事单元的自动分割。介绍了一种视频文本提取算法在辅助驾驶系统中的应用,通过对道路标识牌上的文字提取,从而提供给驾驶员在公路上的导航,如所处位置、方向、限速等信息。算法首先基于颜色信息来定位特定颜色的道路标识牌,然后经过仿射变换,基于笔画算子的种子区域增长算法进行交通标识牌文字的定位、分割和提取。关键词:文字定位;视频文字跟踪;点模式匹配;故事单元分割;车辆导航
琺,/,.畉產,瑅..,.閏甌.,.甀,騛甌,.,,.,甆
..琣...;;;地;
数字视频中文本的提取方法研究 来自淘豆网m.daumloan.com转载请标明出处.