下载此文档

语音处理实验报告.doc


文档分类:高等教育 | 页数:约18页 举报非法文档有奖
1/18
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/18 下载此文档
文档列表 文档介绍
实验一 语音信号的端点检测
一、实验目的
1、掌握短时能量的求解方法
2、掌握短时平均过零率的求解方法
3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检测。
二、仪器设备实验仪器设备及软件
HP电脑,测原理以及LPC特征的求解方法
二、仪器设备
HP电脑、Matlab软件
实验原理
MFCC: 语音识别和说话人识别中,常用的语音特征是基于Mel频率的倒谱系数〔即MFCC〕。MFCC参数是将人耳的听觉感知特性和语音的产生机制相结合。 Mel频率可以用如下公式表示: 
在实际应用中,MFCC倒谱系数计算过程如下; 
1、将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换并得到其频谱。 
2、求出频谱平方,即能量谱,并用M个Mel带通滤波器进行滤波;由于每一个频带中分量的作用在人耳中是叠加的。因此将每个滤波器频带内的能量进行叠加,这时第k个滤波器输出功率谱x(k)。 
3、将每个滤波器的输出取对数,得到相应频带的对数功率谱;并进行反离散余弦变换,得到L个MFCC系数,一般L取12~16个左右。
MFCC系数为 
将这种直接得到的MFCC特征作为静态特征,再将这种静态特征做一阶和二阶差分,得到相应的动态特征。
四、实验内容
〔1〕、实验步骤 
1、输入样本音频 
2、给样本音频预加重、分帧、加窗 
3、将处理好的样本音频做傅里叶变换 
4、进行Mel频率滤波 
5、进行Log对数能量 
6、对样本求倒谱 
7、输出MFCC图像 
〔2〕、MFCC提取程序流程图  
 
五、实验结果
实验三 语音信号的基频提取
实验目的
1、掌握语音信号基频的概念,加深对基频刻画声调特征作用的理解。
2、掌握语音信号基频特征的典型求解方法
二、实验仪器设备及软件
HP电脑,MATLAB
三、实验原理
浊音信号的自相关函数在基因周期的整数倍位置上出现峰值,而清音的自相关函数没有明显的峰值出现。因此检测自相关函数是否有峰值就可以判断是清音还是浊音,而峰-峰值之间对应的就是基音周期。
影响从自相关函数中正确提取基音周期的最主要原因是声道响应。当基音的周期性和共振峰的周期性混在一起时,被检测出来的峰值可能会偏离原来峰值的真实位置。另外,在某些浊音中,第一共振频率可能会等于或低于基音频率。此时,如果其幅度很高,它就可能在自相关函数中产生一个峰值,而该峰值又可以同基音频率的峰值相比拟。
1、自相关函数
对于离散的语音信号x(n),它的自相关函数定义为:
R(k)=Σx(n)x(n-k),
如果信号x(n))具有周期性,那么它的自相关函数也具有周期性,而且周期与信号x(n)
的周期性相同。自相关函数提供了一种获取周期信号周期的方法。在周期信号周期的整数倍上,它的自相关函数可以到达最大值,因此可以不考虑起始时间,而从自相关函数的第一个最大值的位置估计出信号的基音周期,这使自相关函数成为信号基音周期估计的一种工具。
2、短时自相关函数
语音信号是非平稳的信号,所以对信号的处理都使用短时自相关函数。短时自相关函数是在信号的第N个样本点附近用短时窗截取一段信号,做自相关计算所得的结果
Rm(k)=Σx(n)x(n-k)
式中,n表示窗函数是从第n点开始加入。
3、算法
通过对自相关基音检测原理的分析,考虑到检测准确度和检测速率2方面的因素,提出了算法实现方案,并对算法进行了Matlab编程实现。算法包含6个功能模块:带通滤波、取样、分帧、短时能量分析、相关运算、基音检测。
基因周期检测
短时自相关分析
分帧
取样
语音信号
带通滤波
基音检测框图
四、实验步骤
取一段录音作为音频样本。
对样本音频进行采样。
对采样后样本音频进行分帧。
对每一帧求短时自相关函数
算出对应周期。
进行带通滤波去除野点。
〔2〕语音信号基音周期提取的程序流程图:
输入语音信号

采样
分帧
短时自相关分析
带通滤波
输出图像
语音信号基音周期提取的程序流程图
实验源程序
function pitch
x=wavread('');%读取声音文件
figure(1);
stem(x,'.'); %显示声音信号的波形


n=160; %取20ms的声音片段,即160个样点

for m=1:length(x)/n;

语音处理实验报告 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数18
  • 收藏数0 收藏
  • 顶次数0
  • 上传人薄荷牛奶
  • 文件大小135 KB
  • 时间2022-04-06