下载此文档

汉字输入编码幻灯片.ppt


文档分类:IT计算机 | 页数:约41页 举报非法文档有奖
1/41
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/41 下载此文档
文档列表 文档介绍
第四章汉字编码技术 2017-3-20 汉字编码的概念?从广义角度看字典/词典编码方法,用于在字典和词典中的快速定位, 常见的方法:部首、笔画、拼音和四角号码等?从狭义角度看汉字键盘编码,用计算机键盘上的按键为汉字编码汉字编码的概念 ,简称“机内码”,包括存储码、处理码、传输码等 ,简称“外码”或“人机界面编码”,用一套字母数字代码输入汉字 2017-3-20 四角号码编码方法?横一垂二三点捺?叉四插五方框六?七角八八九是小?点下有横变零头?举例:端先取左上角 0,其次取右上角 2再取左下角 1, 最后取右下角 2,端=0212 。 2017-3-20 四角号码取角方法?取角方法(1)一笔可以分角取号。例:以左边是一笔,上取为 2,下取为 7。(2)一笔的上下两段和别笔构成两种笔形的,分两角取号。例:水左边,上取 1, 下取 9。(3)下角笔形偏在一角的,按实际位置取号,缺角作 0。例:妒右下角缺,取为 0。(4)凡外围是“口、门(门) ”的三类字,左右两下角改取里面的笔形。例:田=6040 。(5)一个笔形,前角已经用过,后角作 0。例:王左上角为一横,取 1,右上角因为前面已经用过,所以取 0。附号(1)四角号码字较多时,再取靠近右下角(第四角)上方一个笔形作“附号”,如果这一笔形已被右上角用过,则作 0。(2)四角和“附号”相同的字,照各字所含横笔数目,顺序排列。?取角注意项(1)角形有两单笔或一单笔一复笔的,不论高低,一律取最左或最右的笔形。(2)有两复笔可取的,在上角取较高的的复笔,在下取较低的复笔。(3)当中起笔的撇,下角有他笔的,取他笔作下角,但左边起笔的撇,取撇笔作角。 2017-3-20 汉字编码的发展? 20 世纪 70 年代起步阶段,拼音编码、五笔字形、自然码等,效率较低? 20 世纪 80 年代中期轰轰烈烈的“大跃进”式编码活动,但没有什么发展? 20 世纪 90 年代萧条期?进入 21 世纪后将是又一个发展期,数字编码方案将占主导 2017-3-20 汉字编码中的几个概念( 1) ?字符集/字汇和词汇?字符集/字汇多/少?词汇多/少特指某个编码方案编码词组的集合?码元?组成输入码的字符集合称为码元。如拼音码的码元是“a”-“z”中的任意一个字母;纵横码的码元是“0”-“9”中的任意一个数字。 2017-3-20 纵横码的使用方法?由香港殷商周忠继先生发明、推广的一套以 0-9 十个数字进行编码的小键盘输入法,它以片语/词组作为主要输入方式。?一横二竖三点捺,叉四插五方块六,七角八八九是小,撇与左钩都是零。单字取码 :左上角、右上角、左下角、右下角 1. 33 规则:对二字词组,取每字的头 3码,若不足 3码,则有几码取几码,取完按数字键的9上面的“﹡” 2. 222 规则:对三字词组,取每字的头 2码,若不足 2码,则有几码取几码,同上。 3. 2112 规则:对四字词组,词首尾字各取头 2码,中间每字各只取头 1码,同上。 4. 21111 规则:对多字词组,第一字取头 2码,第二至第五字各取头 1码,余下若字不用取码,同上。 2017-3-20 汉字编码中的几个概念( 2) ?码长?输入码的长度称为码长。如输入码“ 123 ”的码长为 3 ?等长编码,如区位码等?不等长编码,如拼音码、纵横码等?单码和重码?一个编码可能对应多个汉字和词组,那么这些汉字或词组称为重码。一个编码对应的汉字和词组只有一个时,称该汉字和词组为单码。 2017-3-20 汉字编码中的几个概念( 3) ?编码空间和编码效率?所有可能的输入码集合,称为编码空间。?编码空间的大小依赖于码元集合和码长。?如某个编码方案的码元共有 K个,编码采用等长码,长度为 i,则编码空间大小为: C=K i, ?如区位码的编码空间大小为: C=10 4,即 10000 个。?编码效率简单而言是指编码的字汇/词汇除以编码空间的大小。?如区位码,它的字汇大小为 6763 ,则编码效率为 6773/10000 = %。 2017-3-20 汉字的墒(1) ——信息量的概念?熵,在信息论里叫信息量。从控制论的角度来看,应叫不确定性。?最简单的是只有两种可能性,非此即彼,我们以这种事物的信息量为单位,叫 1比特( bit )。如果可能性数目有 2的 n次方( N=2 n),那就是 n比特,即信息量等于可能性数目N的“以2为底的对数”: H= ㏒ 2N=㏒ N/㏒2。?信息量应按符号的可能性(数学上叫概率大小)来计算, 它是概率的负对数。平均信息量就是

汉字输入编码幻灯片 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数41
  • 收藏数0 收藏
  • 顶次数0
  • 上传人494315277
  • 文件大小0 KB
  • 时间2016-07-21