厦门大学
硕士学位论文
英语词汇歧义及英汉机器翻译中词义消歧上下限
姓名:秦少康
申请学位级别:硕士
专业:语言学及应用语言学
指导教师:苏新春;史晓东
20060601
摘要统计方法,分析了英语主要的开放词类——动词、名词、形容词、副词的歧义情让计算机理解语义是五十余年来计算机科学家和语言学家一直致力解决的问题。目前,自动分词、自动词性标注的结果已经可以接受,而计算机对词义的理解正确率较低,在自然语言处理中是亟需跨越的障碍。而词义消歧的良好结果将影响自然语言处理的方方面面,如机器翻译、文本分类、信息提取等等。当前词义消歧总体:取得的结果并不令人满意,这也制约了自然语言处理的进一步发展。本文首先探讨并指出了影响英语词义消歧结果的消歧重点;通过测试给出了英汉机器翻泽词义消歧的上下限;最后实现了一个简单的英汉机器翻译译词选择系统,并以之为例,分析了上述研究在实践中的作用。在进行词义消歧工作时,首先需要了解待消歧语言的词汇的歧义情况。本文利用一些可以获得的资源,包括传统字典、以及之前的统计研究,通过况,指出解决英语词汇歧义的重点在于处理好常用动词、名词的最常用的几个义项。在英汉机器翻译词义消歧中,由于涉及双语,单语的词义消歧上薏辉偈用需要建立针对机器翻译的词义消歧七下限。本文通过统计杏镆灞注实例,得到了最大可能义项,并以之为词义消歧的下限;针对英汉机器翻译的独特特点,本文设计了调查问卷,通过计算人的义项选择之间的一致程度确定了英汉机器翻译中词义消歧的,卜限。隽较钛芯康慕峁谑导锌梢远杂⒑夯鞣胂低持械拇室逑缣峁一定的指导性作用,所以最后,本文实验了一个现有的英汉机器翻译词义消歧算法,根据前述结果对不同的实验结果进行了分析,给出了改进的建议。关键词:机器翻译;词义消歧;上下限
篗.,,..瑆瑃—,狢..瑆瑂琻,.瑃;.
声明人┟:痒叶似“年拢既厦门大学学位论文原创性声明兹呈交的学位论文,是本人在导师指导下独立完成的研究成果。本人在论文写作中参考的其他个人或集体的研究成果,均在文中以明确方式标明。本人依法享有和承担由此论文产生的权利和责任。
稍亏作者签名:搀可锄日期:≥∞辍卧孪θ义融厦门大学学位论文著作权使用声明日期:苣月⒉槐C√/本人完全了解厦门大学有关保留、使用学位论文的规定。厦门大学有权保留并向国家主管部门或其指定机构送交论文的纸质版和电子版,有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅,有权将学位论文的内容编入有关数据库进行检索,有权将学位论文的标题和摘要汇编出⒈C年解密后适用本授权书。版。保密的学位论文在解密后适用本规定。本学位论文属于朐谝陨舷嘤ê拍诖颉”导师签名:射冲
第伦凼“机器翻译是使用电子计算机把一种语言翻译成另外一种语言的一门新学科。⋯机器翻译的研究,在社会政治、商业、科学技术上都会发挥重要作用。如“从科学技术上来说,机器翻译是计算机科学、数学、语言学的一个应用领域,机器翻译的思想,对于这些学科的发展会产生重要的影响。“而随着网络的发展,交流的增长,解决语言障碍的需要越来越迫切,机器翻译的手段将会发挥越来越大的作用。随着中国经济的发展,汉语的国际地位的提高,英汉双语的有效互通也需要英汉机器翻译在其中发挥作用。一词多义现象在自然语言中普遍存在,对原文含义理解的错误将直接导致译文的错误,词义消歧是任何机器翻译系统都必须要解决的问题。但多义词的正确理解牵扯到自然语言的方方面面,如上下文、语义、修辞等都可能造成歧义,而这些恰恰是计算机难以解决的问题,所以词义消歧一直是自然语言处理,包括机器翻译中一个十分困难的问题。,也就是说,要想解决词义排岐问题,就必须先解决人工智能领域所有困难问题,如常识和百科知识的表示”。。早在二十世纪五十年代,计算机开始处理自然语言时,词义消歧就引起了研究者的关心和兴趣。勾勒出了一种词义消歧的方法的基础【俊5牵在六十年代,就声称“在可预见的未来,全自动高质量的机器翻译是不可能的。原因在于大量句子中对人而言没有歧义的含义的确定,超出了机器的能力范围。”。尽管有的悲观预言,词义消歧还是在众多领域得到发展。而在二十世纪八十年代后,随着计算机计算能力的提高、大规模机读文本获取的便利、以及相关统计方法的发展,在分词、词性标注等问题得到较好的处理结果后,词义消歧成为亟待解决的问题。很多研究者认为词义消歧是今天自然语言处。冯志伟..:中国对外翻译出版公司.。:.,&琂.—.脑奈#籉:簍瑄砒
『题。【早期的词义消歧研究最早的词义消歧的尝试开始于机器翻译,不仅勾勒出了一种词义消歧的方法的基础①,还指出上下文窗口大小
英语词汇歧义及英汉机器翻译中词义消歧上下限 来自淘豆网m.daumloan.com转载请标明出处.