语音识别系统的声学建模研究垤,Ⅺ集合。实验证明ⅪP捅菼P途哂薪摘要平均现象,本文首次提出ü薜魃夏溉糇幽P臀S械魃声学建模是语音识别领域中的关键问题之一。本文对汉语连续语音识别中的声学建模技术和参数共享策略进行了深入的研究。主要针对以下两个方面:一、研究了基于决策树状态共享的上下文相关声学建模方法,其中针对声学建模的声学单元选择和决策树问题集设计进行了深入研究和优化;二、针对声学模型训练过程中的实际问题,如训练数据稀疏,模型选择和发音变体等问题对声学建模过程进行了优化。具体包括以下几个方面:訦平台进行了研究和分析,在深入了解教ǖ幕∩展开声学模型训练和性能评估实验。其中,对上下文相关既珻声学建模中基于决策树状态共享策略进行了深入研究。分析了两种不同的决策树构造方法,讨论了问题集的设计和决策树节点的分裂策略,并展开了一系列优化决策树状态共享的上下文相关声韵母疐,.幕呱P偷实验。为了保证声韵母之间的相互搭配关系,在原来的基本声韵母集合上,增加了零声母部分,形成扩展声韵母高的识别率。根据语音学知识优化了决策树问题集的设计,并调整了决策树分类门限,在单混合度下,获得了サ囊粽仿侍嵘攵匝盗酚锪现幸恍┥夏溉糇佑械餮臼臀薜餮臼牟韵母三音子模型做初始化的方法优化声学模型。该方法在相同条件的训练和测试集下提高了识别性能,特别是在有调三音子稀疏现象明显的测试集中效果提高显著。此外,本文研究了声学模型的复杂度调整策略,通过自适应混合分量增长策略,在高斯数日少于混合分量数为保侗鹫仿视牖旌戏至渴时相当,并且在一定程度上减少了高斯总数。芯坎⑹迪至税肓侄胃怕噬P汀8媚P驮诰銱模
知识水坝***@pologoogle为您整理
毋基础上,结合矢量量化技术和连续概率密度描型及其模型混合高斯连续概率模型述的特点,以混合共享的方式来描述各状态的概率分布。在中等词汇量的非特定人连续语音库测试集中,与原来的P相比,混合分量共享声学模型在保证识别率基本不下降的情况下,一定程度降低了模型规模和计算复杂度。此外,本文在基线系统模型基础上,对存在的发音变体进行定位和信息收集,通过有效进行训练语料中出现的发音变体的建模,旨在有效地增强现有模型对各种发音变体的鲁棒性。关键字:语音识别声学建模三音子决策树
知识水坝***@pologoogle为您整理
咖洳协廿训鲫韘酬,柚镚蕂綾靖譴総錸锄侬棚錽辌哪【嘶╠强删刚锄同鲫鷓瑆锄鷈蕄畁响鞒鷆加,耐也盯゛鵺譺辧綿曲崎,也饥丘縤弘衄岱辳琲目萵璽鲥∞订∞.伽襜辭辌蛆∞铭鷇坞琲鷇辴:“∞∞】嘶鹤地自吼嘴觚謉蜊躆,鵲托Ⅲ膇赐耤危鷆謘硒膃∞琤勰琻蝣醖邝住血Ⅱ∞∞∞鑓琧Ⅱ.:缸瓢豁,:縭瓹阛Ⅱ
涸襭,慨肌眦觨.∞骾譭印印琣畂縡鵸】.
型生本学位论文不愿霉敕段В视帽臼谌ㄊ椤日期:兰:酗垫:,本人承担一切相关责任。本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。本人签名:关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论文注释:本学位论文不属于保密范围,。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不日期:留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑导师签名:
第一章绪论鲥际醯哪康模且H语音识别的重要意义语音识别的历史发展随着计算机科学技术日新月异的发展,人类正迈向一个全新的信息时代。而自然语言作为人类最重要最自然的交流工具,是人类获得信息的最重要的来源之一。使用自然语言与计算机之间进行交流是人类长久以来的梦想。语音识别技术语言是人类进行交流的最为直接、最为自然的方式,而语音则和文字一样,是语言的重要载体。近几十年来计算机技术的飞速发展,使得人类社会发生了有史以来最空前的变化,计算机也早已成为我们日常工作和生活中必不可少的组成但是,人与计算机之间的交互水平却严重地滞后于计算机其他技术的发展,远远不能满足人类的需求。因此,如何提高人机交互的友好程度,是一个有着重要意义的研究课题。语音处理技术的重点是要解决计算机的“昕”和“说”的能力,即:如何使计算机理解人类给出的语音信息
语音识别系统的声学建模研究(可复制论文) 来自淘豆网m.daumloan.com转载请标明出处.