下载此文档

语音识别综述.ppt


文档分类:IT计算机 | 页数:约25页 举报非法文档有奖
1/25
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/25 下载此文档
文档列表 文档介绍
语音识别综述
第1页,本讲稿共25页
语音识别的分类
一、从识别单位分为以下几类
。识别的单词间有停顿。
。在连续语音中识别出其包含的几个或某几
个词。
。识别的单词之间没有很少有人用)。
第11页,本讲稿共25页
动态时间规整(DTW)
动态时间弯折是一种效果非常好的非线性时间规整模板匹配法。例如对于孤立词识别系统,将每个词重复多遍发音,直到得到一个一致性较好的特征矢量序列,从而形成一个模板,在识别时,待识别矢量序列用DTW算法分别求得与每个模板的累计失真,然后判别它属于哪一类。
第12页,本讲稿共25页
矢量量化(VQ)
DTW方法是针对时间对准问题的,我们希望不考虑时间顺序任意指定时间对准点,这意味着没有任何时间归一化的处理。矢量量化就时完全忽略时间信息的一种方法。对于孤立词,首先为词会表中的每个但词建立一个码本,这些码本是分离的,它们即为每个单词的模板,识别过程指不过是搜寻誉为指单词有最佳拟合的码本问题,即每个输入矢量必须和每个码本所有码字进行比较。
第13页,本讲稿共25页
神经网络
关于神经网络在语音信号处理中的应用研究十分活跃,其中以在语音识别方面的应用最令人瞩目。目前,主要是从听觉神经模型中得到启发,以便构成一些具有类似能力的人工系统,使它们在解决语音信号处理(特别是识别)问题时能得到较好的性能。研究神经网络以探索人的听觉神经机理,改进现有语音语音识别系统的性能,是当前语音识别研究的一个重要方向。在模式识别的应用中,多采用BP网和RBF网等前向神经网络来实现。
第14页,本讲稿共25页
RBF网络拓扑结构
第15页,本讲稿共25页
RBF神经网络的特点
径向基函数神经网络(简称RBFNN)是一种三层前向神经网络。它的隐层激活函数是一种径向对称的核函数。当输入样本传播到隐单元空间时,这组核函数构成了输入样本的一组“基”。因此,这种神经网络称为径向基函数神经网络。RBFNN具有以下特点:
● 是一种静态网络;
● 与函数逼近理论相吻合;
● 具有唯一最佳逼近点;
● 网络连接权值与输出呈线性关系。
径向基网络与一般的三层BP网结构很相似,区别有两点:
,只有隐层到输出层之间的全值可调节。
,它用一种具有局部作用性质的函数代替了BP网常用的Sigmoid函数。RBF网最常用的激活函数是高斯函数。
第16页,本讲稿共25页
从上面的分析可知,RBF 网络由两部分组成(设输入维数为 p,隐单元数为 m,输出维数为 q):
● 第一部分:从输入空间到隐含层空间的非线性变换层
第 i 个隐单元输出为:
第17页,本讲稿共25页
其中:g(.)为隐单元的变换函数(即径向基函数),一般取为 Gauss 函数,即
x 为 p 维的输入向量,即
为第 i 个非线性变化单元的“中心”向量。
为非线性变化单元的宽度。
第18页,本讲稿共25页
● 第二部分:从隐含层空间到输出层空间的线性合并层
第 j 个输出
其中: 为第 i 个隐单元与第 j 个输出之间的连接权值;
y 为 q 维的输出向量,即 。
第19页,本讲稿共25页
在RBF网络中可以调整的参数有:隐节点激励函数,隐节点中心和半径,隐层节点个数和隐层至输出的连接权值。RBF网络的学习方法有两种:
1.参数同时训练。
2.两阶段训练。
◆确定每个RBF隐单元的中心和半径;
◆调节权值矩阵(线性最小二乘法)。
RBF网络的学习
第20页,本讲稿共25页
基于RBF网络的语音识别原理图
第21页,本讲稿共25页
第一步:提取特征
第二步:确定网络结构
第三步:确定隐函数中心(聚类方法)
第四步:确定半径(根据公式 )
第五步:训练隐层到输出层的连接权值(最小二乘法)
第六步:对测试集单词进行识别
实验步骤
第22页,本讲稿共25页
K均值聚类算法步骤(LBG算法):
即按照一定的失真测度,对训练数据进行分类,从而把训练数据在多维空间中划分成一个个以形心(码字)为中心的胞腔。这个过程需要一个由大量的矢量构成的样本集,经过统计实验后确定出各个胞腔的中心矢量。下面是LBG算法的具体步骤:
第23页,本讲稿共25页
① 初始化: 采用某种适当的方法选一个包含N个码字的初始码本矢量。
②分类 : 按最近邻(Nearest Neighbor)准则,以码字为中心,将训练矢量集中的所有矢量分到各个胞腔

语音识别综述 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数25
  • 收藏数0 收藏
  • 顶次数0
  • 上传人文库新人
  • 文件大小2.24 MB
  • 时间2022-02-12
最近更新