中文摘要在信息爆炸的当今社会,如何对信息进行有效的分析、处理和提取显得尤为重要,本文讨论的汉语关键词识别和主题检测就是关于这个方面的研究。一、论文系统地介绍了汉语关键词识别的相关理论、解决方案及实验分析。对关键词模型的识别基元作了详细讨论;根据汉语语音和关键词识别的特点,提出了四种比较新颖的废料模型聚类方式,增强了汉语关键词识别系统的实际应用二、在汉语主题检测技术的研究中,采用了文本分类理论。详细地分析了文本分类的各种方法,介绍了文本分类所需要建立的向量空间模型、具体分类检测的各个流程及相关步骤等,并通过实验重点分析了主题检测的过程。三、在充分地实验讨论了关键词和主题检测的基础上,最后将关键词识别和主题检测有机地结合了起来,在智能家庭普适计算系统中得到了有效的应用,初步实现了智能家庭普适计算系统智能服务的功能。关键词:关键词识别;主题检测;普适计算摘要:性。
知识水坝***@pologoogle为您整理
卸:;.’瓾痵...琾甌疭瑆.....瑄痶,籔
知识水坝***@pologoogle为您整理
导师签名:为穑簐騀西签字日期:扣诨以律ㄈ学位论文版权使用授权书沙辏缴橙本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。C艿难宦畚脑诮饷芎笫视帽臼谌ㄋ得签字日期:学位论文作者签名:
独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作学位论文作者签名:签字日期:年了明确的说明并表示了谢意。月日
致谢本论文的工作是在我的导师苗振江教授的悉心指导下完成的,苗振江教授严谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来苗振江老师对我的关心和指导。茁振江教授悉心指导我们完成了实验室的科研工作,在学习上和生活上都给予了我很大的关心和帮助,在此向苗振江老师表示衷心的谢意。苗振江教授对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷心的感谢。在实验室工作及撰写论文期间,众多博士硕士师兄弟以及王琛、张超、邢静等同学对我论文中的研究工作给予了热情帮助,在此向他们表达我的感激之情。另外也感谢我的家人,他们的理解和支持使我能够在学校专心完成我的学业。
:语音识别和语言理解。这两个领域因其较高的研究难度、较大的研究价值和较广的应用意义而成为当今学术界的两大热点难点研究领域,它们之间有着很大的区别,但也有着一定的联系,如何将它们完美地结合起来达到对信息进行有效分析、处理和提取的目的是一个很值得研究的课题。由于语音识别和语言理解受到技术水平、实验环境条件等多方面因素的限制,真正把两种技术融合起来达到有效分析、处理和提取信息的效果还需要更多的努力。本文是采用语音识别中的关键词识别技术和语言理解中的文本分类技术来研究汉语关键词识别和主题检测的。下面就分别介绍一下关键词识别技术和文本分类技术。所谓关键词识别褪窃诹摹⑽尴拗频淖匀挥镆袅髦惺侗鸪鲆蛔楦定词丶的语音识别技术。使用关键词识别技术进行识别,并不需要把整个的语音全部识别出来,只需要从语音中抽取出所关心的部分词汇,而不必理会其余的词汇和噪声。关键词识别的任务是在连续的话语中识别出给定的词,因而它首先是一种连续语音识别;但它又不要求把整个的语音流全部识别出来,因此可以说关键词识别是连续语音识别的一个分支。其次,对发音人的要求又不可能像对连续语音识别发音人那么高,因此关键词识别又不同于连续语音识别。考虑如下五个方面的差别,隒有时又被当作两个不同的问题来处理。模型的训练问题:P屯>褐5牟煌⒁羧尤其是可以包括使用者在内拇罅渴萁醒盗罚鳮则不大可能让被识别对象对其模型进行大量的训练。词汇表问题:G竺扛龃侗鸬拇或单元匦胧且桓鲇邢薮时碇械一个,它的词汇表是封闭式的;而市硎淙氲挠镆舭丶蚀时硗的任何词,它的词表是开放式的。语法或词法问题:G笫淙胗镆糁械拇市蛄惺芟抻谝桓鲇邢拮刺锓ㄍ引言
.谋痉掷络,也就是说它要求输入严格符合它所假定的一组句式模型;而蛭此要求,它不需要输入符合某种旬式模型。发音人的态度:对一个低常⒁羧四芄灰馐兜阶约赫谟牖鹘薪流,希望所说的话能够被机器正确识别,故而他们一般持合作的态度,也能够根据系统的提示重新发音;但在低持校祷叭顺3J呛廖拮急的,多数情况是处于自然会话的发音方式,也不太可能重复不太清楚的语环境
汉语关键词识别与主题信息提取的研究及应用(可复制论文) 来自淘豆网m.daumloan.com转载请标明出处.