兰州理工大学
硕士学位论文
与文本无关的说话人特征提取及识别方法研究
姓名:王贞
申请学位级别:硕士
专业:检测技术与自动化装置
指导教师:李战明
20060401
摘要本文针对说话人识别技术目前存在的技术难点进行了深入的研究,研究内容对于特征参数的提取,目前使用最为流行的特征参数是基于人耳听觉特性的蛊紫凳鳰腔谟镆粜藕哦淌逼轿鹊募偕瑁诙淌备立叶变换的基础上提取的。实际上语音信号是一种典型的非平稳信号,短时分析不会随着时间的变化改变分辨率,而小波分析是一种信号的时间一尺度分析方法,它具有多分辨分析的特点,因此本文在基于研究了的提取原理的基础上,结合小波包对频带的多层次划分,并根据人耳感知频带的特点即德实姆植迹选择相应小波包分析后的结点频带,提取出一种基于小波包分析的新型特征参数对于分类器的设计,主要应用人工神经网络技术,建立了基于绲乃话人识别系统。针对系统性能随时间下降的问题,本文在分析了已有法与人工神经网络法的基础上,融合两者的优点,提出了一种与人工神经网络相结合的说话人识别系统,该系统能有效的解决随着时间的变化,系统模型失配的问关键词:说话人识别;特征参数;;小波变换;分类器;纾籐网络说话人识别是根据人特有的语音信号来识别出说话人身份的一种生物认证技术,在说话人识别技术中,关键在于两方面:其一,如何从数据量相当大的原始语音信号中提取出反映说话人个性特征的参数。其二,设计出行之有效的分类器。主要包括两方面:。题。硕士学位论文
糲籑籛与文本无关的说话人特征提取及识别方法研究。籐,,—,,.,瑆狪,琣琣,篠籉籖羣Ⅱ
插图索引⋯⋯⋯⋯.图说话人辨认和说话人识别⋯⋯⋯图语音信号产生的离散时间模型⋯⋯⋯⋯⋯⋯⋯..⋯⋯图三层多分辨分析树结构图⋯⋯⋯⋯图三层小波包树分解⋯图说话人识别的组合神经网络模型⋯..⋯⋯⋯⋯⋯⋯窬缒P徒峁雇肌图三个人的参数⋯⋯⋯⋯⋯⋯图三个人的参数图说话人识别系统框图图倒谱的提取图的提取过程叨嚷瞬ㄆ髯图神经网络用于说话人识别系统的结构图应用的说话人识别系统⋯缃峁雇图新说话人识别系统框图⋯硕士学位论文.
兰兰奎垂塑墼些型墼型些壅堡二———一附表索引瞬ㄆ髯榈姆植肌表小波包分解结点选取⋯⋯⋯⋯与各划分频带中心⋯与识别率比较模型与本文模型识别率比较幅拍”鹌∞砣铅酆钉舛表鋈说牟煌P徒峁辜笆侗鸾峁个人的模型结构及识别结果与识别率比较⋯.
嘞寸√年弘月銮。莩良辍⒃律兹作者签名:五茨兰州理工大学学位论文原创性声明学位论文版权使用授权书日期:加,/年日献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡法律后果由本人承担。本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意被查阅和借阅。本人授权兰州理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于年解密后适用本授权书。⒉槐C芑亍朐谝陨舷嘤Ψ娇蚰诖颉啊獭作者签名:导师签名:⒈C芸冢日期:
第一章绪论说话人识别的发展概况随着计算机技术和信息化社会的发展,人类进入了信息时代,面对信息革命的挑战,面对越来越多各种各样的信息,人们需要寻找更有效的处理信息的方式,语言是人类特有的功能,声音是人类常用的交流工具,是相互传递信息的主要手段。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。因此,语音是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与人类文明的进步紧密相连,所以它具有最大信息容量和最高的智能水平。现在,人类已经进入了信息化时代,用现代技术手段研究语音处理技术,使人们能更加有效地传输、存储、获取和应用语音信息,这对促进社会的发展具有十分重要的意义。语音是人的自然属性之一,由于各个说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩。因此每个人的语音中蕴含着与众不同的个人特征,如果能从每个人的语音中提取出他或她的个人特征,那么我们就可以把这些作为他们的标识,从而在不同场合利用他们的语音来鉴别他们的身份“说话入识别是根据人的语音信号来识别人的一种生物认证技术。说话人识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。因此,说话人识别着重的是说话人的声道变化和说话的习惯等个性特征。由于说话人之间的发音
与文本无关的说话人特征提取及识别方法研究 来自淘豆网m.daumloan.com转载请标明出处.