12019/4/7摘要准备工作手写识别过程联机藏文手写识别的预处理联机藏文手写识别特征提取聚类实验方法和结果22019/4/7准备工作藏文文字的组成藏文的字符集编码标准GB/T16959-1997《信息技术藏文编码字符集基本集》GB/T20542-2006《信息技术藏文编码字符集扩充集A》字母→字丁(字符)→音节→词→句子32019/4/7藏文字丁的书写特点基本处理单元的选择藏文文字的结构特点相关国家标准识别编码范围《基本集》和《扩充集A》在内的910多个字丁,剔出掉了不常用的梵文字符准备工作42019/4/7准备工作联机藏文手写识别的研究基础参考结构文字的联机特征提取方案还是拼音文字的联机特征提取方案?藏文识别相对于汉字识别的特点宽高比1:2笔画方向性圈、弧状结构52019/4/7准备工作藏文手写识别难点易混淆字过多印刷体相似字手写体相似字f41ef37df42af3aef4ebf5e1f327f497f3b4f49c62019/4/7联机藏文手写识别流程识别基本流程预处理了对手写输入的字符在字形上进行修正,减少同类字符输入样本间字形上的变异。是保证特征提取和识别算法的有效性的前提。特征提取根据经过预处理后的联机手写字符,提取出相对于位移、大小、旋转、变形等具有不变形的模式特征。预处理特征提取分割分类后处理语料库word72019/4/7联机藏文手写识别的预处理预处理主要操作线性归一化,减少字符大小的变异。加入虚拟点,使字的每个笔画的点密度相同。非线性归一化,减少笔划形状的变异(笔画太长、太短,笔画太集中等)。重采样,减少点的间距的变异以及笔划上点的数目的变异。点的平滑,去除笔画上的噪点。82019/4/7线性归一化操作的选取公式及宽高比确定进一步改进联机藏文手写识别的预处理92019/4/7非线性归一化方案的选取基于线密度基于交叉距离基于点密度联机藏文手写识别的预处理方案1:“初始方案”,使用基于点密度的非线性归一化操作;方案2:基于线密度的非线性归一化操作。方案3:基于基交叉距离的线密度非线性归一化操作。方案4:改进后的基于点密度的非线性归一化操作。102019/4/7联机藏文手写识别的预处理对基于点密度的非线性归一化方案的改进笔画断裂、笔画间不连续的原因直方图投影变化剧烈解决方案
联机藏文手写识别概述 来自淘豆网m.daumloan.com转载请标明出处.