南京师范大学
硕士学位论文
普通话的情感语音韵律分析
姓名:刘艳
申请学位级别:硕士
专业:中国语言文学;语言学及应用语言学
指导教师:顾文涛
20110430
摘要随着人机交互技术的快速发展,近年来语音信号中的情感信息处理成为语音研究的热点之一,本文主要对情感语音韵律进行分析。本研究使用声学分析结果与感知实验结果相结合的方法、对比分析法及统计分析法,在建立相应情感语音数据库的基础上,对情感语音韵律进行了较为深入的研究和探讨。通过研究,本文发现:高兴、愤怒、悲伤、惊奇和中性语音在韵律特征如语调、语句时长、语句基频最大值、语句基频最小值、重音位置时长等方面存在一些显著性差异,具体表现如下:重音听辨结果上:愤怒语句重音出现频率最高,悲伤语句重音出现频率最低。高兴重音多位于句尾,愤怒重音多位于句中,悲伤重音多位于句中、句尾位置;惊奇句尾重音居多。在语句基频与声调上:高兴、愤怒、悲伤、惊奇、中性调域大��页序为:愤怒�F�高兴�行�悲伤;高兴与愤怒相比基频高低值之间的过渡平缓;高兴语调以为高调阶窄调域为主;愤怒基频多分布在高频段,语调以高调阶宽调域为主;悲伤的基频整体变化不大且多分布在低频段,语调以低调阶窄调域为主,各位置处音节较多地保持了单字的调型;惊奇句尾基频上升,语调以高调阶宽调域在句重音音节基频表现上:愤怒重音位置处调域拓宽幅度最大,其次为惊奇。悲伤和中性略有拓宽,高兴重音位置处调域拓宽幅度大于悲伤和中性。在时长特征上:高兴、愤怒、悲伤、惊奇、中性语速快慢为:愤怒�咝�中性�F�悲伤;愤怒重音时长占整句话时长比例最大,悲伤重音时长占整句话时长比例最小,惊奇重音位置处音节时长增幅最大。在停顿上:高兴停顿次数最少,停顿总时长最短;悲伤停顿次数最多,停顿总时长最长。本文创新点主要有:为检验语料质量,进行了情感类别、情感表达程度和情感焦点的听辨实验,使语料库信息更完善、全面,便于深入研究。本文使用声学分析结果与听辨实验结果相结合的方法,对情感语音韵律特征进行分析和描述,增强了分析的理据性。关键词:情感语音听辨实验语调分析声调分析为主。
猙��;�����������������������������,���.�������籗�����:�������������,������������琫������������瑄�������,��。�������:����������瑂������������瑃���������������,����,��甋��������;����������:�����������������.������;��������猙��.��,���������甋�����篽���������,�����琻����������������������籄������.�����.����,�������,�������:��������;��������琻�������籋��,����;���.������—���������籗�����畃���������瑃�����:���疭���疭�:�����.����疭����·
.摘要���,����������,���������������瑃������������������琩�����������������篍���������.��������簆�����籗������琹�����,�������琧�������,���,����������,����,��:
第�滦髀���研究背景与研究意义��.�芯勘尘�语言是人类最重要的交际工具,语音是语言的载体。人类话语中不仅包含了文字符号信息,而且还包含了人们的情感和态度变化等方面的信息。由于表达时语气、情感等方面的差别,文本相同的语音可能具有不同的含义和交际功能。因此,情感表达在语音交流中具有重要作用。然而,当前的计算机语音技术在处理语音中所包含的表意信息的同时,忽略和丢弃了大量的表情信息。例如:语音识别系统将语音转化为文字,但损失了与说话人说话方式、态度倾向、情感状态等相关的信息;大多数的语音合成系统只能产生朗读状态下的合成语音,远远不能合成自然的、具有不同语气、表达多种情感的语音。这些问题大大降低了人机语音交互的效果和效率,限制了人机交互的自然性。随着计算机技术的高速发展,计算机在人类的工作、学习和生活中发挥着越来越大的作用。与此同时,人们对计算机的要求也越来越高。现今的计算机基本上不具备智能或者只具有简单的智能,已经不能满足人们日益提高的要求,人们希望今后的计算机具有人类般的智能,使人机之间的交互像人与人之间的交流一样畅通无阻,以此让计算机发挥更大的作用,更好地为人类服务。如何实现计算机的拟人化,使其能感知周围环境和气氛以及对象的态度、情感等内容,自动适应地为对话对象提供最舒
普通话的情感语音韵律分析(文学) 来自淘豆网m.daumloan.com转载请标明出处.