下载此文档

普通话的语音情感识别技术.doc


文档分类:论文 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
普通话的语音情感识别技术.doc普通话的语音情感识别技术
1引言
语音是人们交流的主要方式,语音信号不仅传递语义信息,而且通过高低强弱、抑扬顿挫来表达说话人丰富的情感信息。当说话人愤怒时,音调升高、语速加快;悲伤时,语调低沉、语速缓慢。听者可以通过语音信号感受说话人的情感变化。如何使计算机从语音信号中自动识别出说话人的情感状态及其变化,是实现自然人机交互界面的关键前提,具有很大的研究价值和应用价值。例如:可以用于对服务中心用户紧急程度的分拣,从而提高服务质量;用于对汽车驾驶者的精神状态进行监控,从而在驾驶员疲劳时进行提醒,避免交通事故的发生;用于对抑郁症患者的情感变化进行跟踪,从而作为疾病诊断和治疗的依据等。计算机的语音情感识别能力是计算机情感智能的重要组成部分。目前,国内外学者在这方面进行了大量的研究。
对语音情感相关特征的有效提取是该领域内十分重要的研究课题。由于语音情感本身自有的复杂性,还没有占据重要地位的有效情感特征被提出[1].寻找合适的情感识别算法,也是本领域研究者一直以来努力的目标。
Origlia等人[2]使用基频和能量相关特征的最大值、最小值、均值、标准差组成了一个31维的韵律特征集,在一个包含有意大利语、法语、英语、德语在内的多语种情感语料库上取得了接近60%的识别率。
Seppnen等人[3]使用基频、能量、时长相关的43维全局韵律特征进行芬兰语的情感识别,在说话人不相关的情形下取得了60%的识别率。
Li等人[4]提取了频率微扰和振幅微扰并将其作为声音质量参数对SU-SAS数据库中的语料数据进行了说话人不相关的情感识别,HMM(Hidden Markov Model)被用作识别器,同仅使用Mel频率倒谱系数(Mel-Frequency Cepstral Coefficients,)%的识别率相比,%的识别率,%的识别率,%、频率微扰和振幅微扰的共同组合获得。
Nulti-layer perceptron)建立了一个OCONX络模型,对8种情感进行识别,所使用的数据库是自行录制的,有100位说话者参与录制。实验表明,%.上述研究大多数都是针对西方语种的语音情感。而针对普通话语音情感的研究则较少,基本都是在国内进行,主要研究机构有东南大学、微软亚洲研究院、清华大学、浙江大学及台湾的一些大学和研究所等。由于普通话与西方语种发音的方式不同,普通话是声调语言,而英语等西方语种是重音语言,因此能准确表达情感的特征必然不尽相同。
针对普通话的语音情感,本文在普通话情感语料库上提取了一些与其它研究不同的语音情感特征参数组合,接着对原始特征集合利用主成分分析(Principal ponent Analy-sis,PCA)来降低维数,然后采用多类分离支持向量机(Sup-port Vector Machine,SVM)进行建模,最后进行大量识别测试实验。
2语音情感识别系统结构
本文的语音情感识别系统结构如图1所示,每个步骤之间通过样本数据进行关联。情感特征的提取、PCA降维和SVM建模是其中的关键环节。

3语音情感特征的提取
情感语音库能为情感建模和情感语音声学特征分析提供统计数据支持,同

普通话的语音情感识别技术 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数5
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小博士
  • 文件大小57 KB
  • 时间2018-02-22