排版方式识别方法和装置的制作方法
专利名称:排版方式识别方法和装置的制作方法
技术领域:
本发明涉及计算机信息处理领域,尤其涉及一种排版方式识别方法和装置。
背景技术:
版式文档的页面可以包含一个或多个文字块,每个文字块包含一个或要说明的是,原始块的水平基线值和垂直基线值是原始块的属性值,版式文档制作者在输入文字时,会自动设置原始块的水平基线值和垂直基线值。步骤13中,确定计算得到的水平基线差值中出现次数最多的水平基线差值以及计算得到的垂直基线差值中出现次数最多的垂直基线差值,其具体实现方式可以如下预先建立用于存储水平
基线差值和水平基线差值出现次数的第一映射表、以及用于存储垂直基线差值和垂直基线差值出现次数的第二映射表;在步骤12中每计算得到一个水平基线差值后,在第一映射表中查找该水平基线差值,若查找到,则将该水平基线差值对应的出现次数加1,若未查找到,则将该水平基线差值保存在第一映射表中,并设置该水平基线差值出现的次数为1 ;在步骤12中每计算得到一个垂直基线差值后,在第二映射表中查找该垂直基线差值,若查找到,则将该垂直基线差值对应的出现次数加1,若未查找到,则将该垂直基线差值保存在第二映射表中,并设置该垂直基线差值出现的次数为1 ;每个水平基线差值对应的出现次数的初始值为0 ;在第一映射表中查找出现次数最多的水平基线差值,将查找到的水平基线差值确定为计算得到的水平基线差值中出现次数最多的水平基线差值;在第二映射表中查找出现次数最多的垂直基线差值,将查找到的垂直基线差值确定为计算得到的垂直基线差值中出现次数最多的垂直基线差值。步骤14中,根据确定的出现次数最多的水平基线差值和出现次数最多的垂直基线差值确定文字块内原始块的排版方式,其具体实现方式可以如下若出现次数最多的水平基线差值与文字块内的原始块的宽度值(即字宽)的差值的绝对值在预先设定的第一取值范围内,并且出现次数最多的垂直基线差值与0的差值的绝对值在预先设定的第二取值范围内,则确定所述文字块内原始块的排版方式为横排;横排的排版方式可以参见图3A;若所述出现次数最多的水平基线差值与0的差值的绝对值在预先设定的第三取值范围内,并且出现次数最多的垂直基线差值与所述文字块内原始块的高度值(即字高) 的差值的绝对值在预先设定的第四取值范围内,则确定所述文字块内原始块的排版方式为竖排;竖排的排版方式可以参见图3B ;若所述出现次数最多的水平基线差值的绝对值大于所述出现次数最多的垂直基线差值的绝对值,则确定所述文字块内原始块的排版方式为横排式斜排;横排式斜排的排版方式可以参见图3C ;否则,确定所述文字块内原始块的排版方式为竖排式斜排;竖排式斜排的排版方式可以参见图3D。为了保证排版方式确定结果的精确性,第一取值范围可以为0. 6-1,第二取值范围可以为0. 01-0. 09,第三取值范围可以为0. 01-0. 09,第四取值范围可以为0. 6_1。当然,如果不考虑排版方式确定结果的精确性,第一取值范围、第二取值范围、第三取值范围和第四取值范围可以为不小于0的任何数值范围。较佳的,在确定文字块内原始块的排版方式为横排之后,可以进一步确定横排的排版方向,具体如下确定步骤12中计算得到的数值大于0的水平基线差值的个数与计算得到的数值小于0的水平基线差值的个数的差值;
若确定的差值大于0,则确
排版方式识别方法和装置的制作方法 来自淘豆网m.daumloan.com转载请标明出处.