中国优秀硕士学位论文全文数据库 2011年 第S1期 信息科技辑
Chinese Master's Theses Full-text Database 2011, Information Science and Technology I138-1845-1
基于依存句法分析的语义角色标注
胡禹轩
学位授予单位: 哈尔滨工业大学; 学科专业: 计算机科学与技术
摘 要
随着计算机处理能力的提高以及统计机器学习等理论的发展,浅层语义分析逐渐被研究人员所重视。语
义角色标注是浅层语义分析的一种实现方式,其具有问题定义清晰,便于人工标注和评测等优点,同时又具有
非常广泛的应用前景。
对语言的深层处理过程中,句法分析处于一个十分重要的位置,也是浅层语义分析最直接的基础。在句
法体系中,依存句法以其形式简洁、易于标注、便于应用等优点,逐渐受到研究人员的重视。在句子分词结果
的基础上,依存句法分析不引入新的短语节点,句法结构信息附加在词和词之间的关系上,句法分析结果得到
相对的简化;其分析结果趋向扁平化,句法树层次较浅,这使得句法树上的节点之间距离相对缩短,简化系统的
同时也更利于研究节点之间的关系;句子中原本线性距离很远的节点有可能存在很近的甚至是直接的依存
关系,这有利于在意义层面对句子结构的理解。
本文实现了一个基于依存句法分析的语义角色标注系统,它将语义角色标注任务分为谓词识别、谓词分
类、语义角色识别和分类、标注结果生成等四个部分。这个系统参加了 CoNLL2008 国际评测,其 F-Score
达到 ,最终取得了第二名的好成绩。
传统的语义角色标注结果生成阶段只利用或主要利用了角色本身和角色与谓词之间的上下文信息,而
没有挖掘同一谓词的多个不同角色之间的相互作用,即谓词框架的全局信息。本文在参加 CoNLL2008 评测
的系统的基础上,利用柱状搜索算法生成若干较好的候选标注结果,再使用 Online Passive-Aggressive 算法训
练一个用对数线性模型对候选结果进行重排序。最终又取得了 %的性能提高。
关键词:语义角色标注;;依存句法分析;;重排序
中图分类号:
Abstract
With the improvement of computing power of modern computer systems and development of theories like
machine learnin
基于依存句法分析的语义角色标注 来自淘豆网m.daumloan.com转载请标明出处.