中文分词词典机制的研究中文分词词典机制的研究42福建电脑2010年第3期中文分词词典机制的研究,(1,德州职业技术学院计算机信息技术工程系山东德州2530342,.-科学技术学院山东青岛266061)【摘要】:中文分词是中文信息处理的前提,本文研究了已有的分词算法,分词词典机制,提出了一种新的词典机制一一带词长整词--~i,-,.【关键词】:中文分词词典机制带词长整词二分词典一,,搜索引擎,机器翻译(MT),语音合成,自动分类,自动摘要,:基于字符串匹配的分词方法,基于理】.解的分词方法和基于统计的分词方法【:基于整词二分的分词词典机制,基于TRIE索引树的分词词典机制,基于逐字二分的分词词典机制分词词典是汉语自动分词系统的一个基本组成部分.【2】自动分词系统所需要的各类应用信息(知识)(如因特网上的中文文本检索,,,"充分大的"(识别出一个词).按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配:按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配::1)正向最大匹配法(由左到右的方向);2)逆向最大匹配法(由右到左的方向):3)最少切分(使每一句中切出的词数最小).:f1),效率就比较低,:,,,这意味着前97次的匹配算法是徒
中文分词词典机制的研究 来自淘豆网m.daumloan.com转载请标明出处.