基于隐马尔科夫模型的语音合成技术研究(可复制论文).pdf


文档分类:通信/电子 | 页数:约110页 举报非法文档有奖
1/110
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/110
文档列表 文档介绍
摘要随着目前语音合成效果的逐步改善,用户对语音合成系统提出了更高的要求,尤其是多样化语音合成方面的需求。在这种背景下,一种能够在短时间内通过自动训练的方式进行合成系统构建,从而满足用户多样化需求的语音合成技术,有着很高的理论研究及使用价值。对此,本论文在基于目裳盗酚镆合成方面,包括技术框架构建、关键技术改进以及相关技术应用,进行了深入而系统的研究,本论文具体的研究工作和研究成果如下。.首先,本论文对基于隐马尔科夫淖远蟹旨际踅蟹治龊透慕通过分析练流程中采用的最大似然准则的训练算法与自动切分目标的不匹配问题,本文提出一种基于切分误差最小化准则的区分性训练算法。在该算法中,首先通过引入一个新的切分误差度量来定义切分误差函数,然后基于一般化的统汁梯度下降算法阅P筒问杏呕佣到切分误差最小化的目的。基于淖远蟹旨际醯姆治龊透慕ぷ鳎1文后续进行纳钊胙芯康於ㄒ欢ǖ幕其次,本论文基于现有的模型训练和参数生成技术,建立了一个完整的技术框架,包括一个自动化的训练流程和相应的合成后端。它可以根据用户的需求,通过输入一定的语音数据进行自动训练,并快速形成一个相应的合成系统。此外,在此框架基础上,本文通过设计和优化中文上下文相关属性和问题集,进行了中文系统的训练和构建,对技术进行效果验证。第三,基于前面构建的际蹩蚣埽疚亩訲际分别进行几个方面的改进。首先在谱参数建模方面,通过对猚和线谱对问奶氐愫徒PЧ治觯⒖悸堑絃参数与共振峰之间的对应关系,最终结合推湎嗔诮撞罘諨参数进行谱参数建模。其次,对于韵律节奏感不强的问题,本文在状态时长模型的基础上加入了基于声韵母单元的时长模型,并在合成中对两种时长模型进行加权来进行时长预测。此外,针对现在模型训练流程中采用的最大似然准则与合成目标的不匹配问题,本文提出了一种基于最小生成误差荚虻腍训练算法。在得到结果验证后,本文对荚蚪幸欢ǖ募蚧⑼ü杓坪侠淼分裂问题选择策略,将该准则应用到上下文相关模型的聚类中。最后,在上述模型训练和聚类算法的改进基础上,本文对整个难盗妨鞒探兄中国科学技术大学博士学位论文
知识水坝***@pologoogle为您整理
关键词:语音合成,隐马尔科夫模型,可训练语音合成,最小化生成误差准则新设计,使得模型训练完全围绕着荚蚶唇小最后,本文基于际蹩蚣芙卸嘌镆艉铣煞矫娴挠τ谩在多说话人语音合成方面,本文采用模型自适应的方式进行说话人转换,并针对少量目标语句的情况,通过对模型自适应的转换矩阵类型进行优化来提高转换效果。在富于表现力的语音合成方面,本文分别进行了语气语调的实现以及情感语音合成系统的构建以及效果分析。而对于多语种语音合成应用,矫姹疚幕已有的纯英文语音库,通过设计合理的属性和问题集,并针对英文的发音特点进行相应的人工标注,来实现英文合成系统并优化效果;另一方面,本文还基于模型自适应技术尝试了东北话的方言合成。最后,本文将:τ玫绞际的嵌入式环境下。中国科学技术太学博士学位论文摘要Ⅳ
知识水坝***@pologoogle为您整理
、:。甧垮啊”二、∞㏒.,时,醇縤。瑃畁,。瑃猚阛琫琓,曲猙,.:琩..甧,,.甌,瑆..畉甌琫—瑃’產產中国科学技术大学博士学位论文。。’㈡’~’..,¨“一,。。、:..
。.瓼。‘辴.∥。—.琀,瑃.,,.痶瓼,。.痑簈簊‘。:,弧篶’.‘眓。產‘’..。
、语音理解,听觉一“理和语言感知也有较大进展,珈之超大规模集成电路、随着信息时代的到来,计算机己成为人类不可缺少的日常工具。在计算机中,通常人机交互界面以键盘为主。为了使计算机的界面与人更加“友好”,科学家开发出了若干种易学易懂、操作简单的界面。其中最方便最自然的界面首推口述语言。基于语音识别、语音合成及自然语言理解的人机语音对话技术是世界公认的一个难度很大,极富挑战性的高技术领域。它的前景十分光明,领导世界软件潮流的微软首领比尔盖茨说过,“在不久的将来,%的网络软件将是在语音驱动下完成的。”近几年来,语音识别、合成技术发展很快,和它有关的语言学、电子计算机、数字信号处理、:人工智能等取得了突飞猛进的发展,以及最近两年的国际互联网的迅速生长和全球信息基础设施建设热潮,这为人机语音对话的研究提供了更好的理论和物质基础以及需求牵引。⋯作为人机交互的核心技术之一,语音台成近年在技术和应用方面都取得了长足进展。随着电子计算机的运算和存储能力的迅猛发展,’语音合成技术由早期的基于规则的参数合成,到基样本的拼接调整合成,并逐渐发展为现在比较流行的基于大语料库的拼接合成。与此同时,台成语音的自然度和音质都得到了明显的改善,在一:定程度上达到了人们的应用需求捍佣俳似湓谑导氏低持械应用。‘目前,语音合成技术已经在自动应答呼叫中心ń鹑凇⒌缧藕驼、电话信息查询ㄌ炱⒔煌ê吐糜

基于隐马尔科夫模型的语音合成技术研究(可复制论文) 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数110
  • 收藏数0 收藏
  • 顶次数0
  • 上传人mkt365
  • 文件大小0 KB
  • 时间2013-11-12