分类号密级
UDC
机
购
物
小
票
数
字
识
别
算
法
硕士学位论文
研
究
POS 机购物小票数字识别算法研究
作者姓名: 郑武
西
华
学科、专业: 计算机应用技术
大
学
学号: 2120**********
硕
士
指导教师: 黄襄念(教授)
学
位
论
完成日期:
文
Classified Index:
UDC:
Xihua University
Master Degree Dissertation
Method for numeral recognition of shopping
receipts of POS machine
Candidate : Zheng Wu
Major : Computer Application Technology
Student ID: 2120**********
Supervisor: Prof. Huang Xiangnian
April, 2014
西华大学学位论文独创性声明
作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究
工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,
本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请
学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献
均已在论文中做了明确的说明并表示了谢意。
若有不实之处,本人愿意承担相关法律责任。
学位论文作者签名: 指导教师签名:
日期: 日期
西华大学学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,在校
攻读学位期间论文工作的知识产权属于西华大学,同意学校保留并向国家
有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,西
华大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采
用影印、缩印或扫描等复印手段保存和汇编本学位论文。(保密的论文在解
密后遵守此规定)
学位论文作者签名: 指导教师签名:
日期: 日期
西华大学硕士学位论文
摘要
伴随着科技的发展和社会的进步,POS机购物小票作为商场和一些商业机构留给客
户的销售凭证,不仅可以反映我,也体现出消费者喜欢怎么样的商品品种,
对于研究消费者的购物趋势和商品的价值具有深远的意义。OCR技术在我国已经很成熟
了,对于购物小票的有效识别是我们需要解决的问题,识别过程中的每个步骤都非常关
键,也是直接影响识别效果的决定行因素。
收集不同超市、不同类型的购物小票作为样本,对于不同大小、长短的购物小票经
过摄像机或者扫描机采集图像,对采集数据图像进行灰度化、二值化、倾斜校正、平滑
去噪预处理过程进行算法改进,选择效果好、适合实验数据的样本。
本文设计了一种改进的连通域分割法对字符图像进行分割,对分割后的字符图像进
行尺寸归一化处理,使字符大小统一,便于实验数据分析。从混合排版的文本中判断那
些是数字字符,通过提取数字字符所特有的特征和数字字符像素点总数作为依据进行判
断,并提取数字的结构特征。
本文对 PSO优化算法进行了改进——参数优化,利用优化参数设计支持向量机分类
器对印刷体数字进行识别,使数字字符识别正确率最大化以达到所要求的效果。经过不
断对算法的改进和对实验结果的研究,并与其它的识别结果进行比较发现本文采用的方
法不经具有很高的识别率,并且具有一定的实用价值,实验结果表明本文的算法是有效
的。
关键词:OCR;字符识别;支持向量机;粒子群优化;
I
POS 机购物小票数字识别算法研究
Abstract
By the improvement of science and the development of society, as the sales document
POS ticket can not only reflect the level of consumption our country, but also indicate the
type of goods which catch the fancy of consumers, which is important for learning the trend
in shopping and the values of goods. Although OCR is mature in our country and effective
recognition of the shopping receipt is still many problems need us
POS机购物小票数字识别算法研究 来自淘豆网m.daumloan.com转载请标明出处.