下载此文档

DSP语音识别实验报告.doc


文档分类:通信/电子 | 页数:约28页 举报非法文档有奖
1/28
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/28 下载此文档
文档列表 文档介绍
DSP课程设计实验报告语音识别院(系):电子信息工程学院自动化系设计人员:李彬学号:设计人员:宋淦泉学号:ﻩ成绩:工程设计50报告20答辩30总分评语:指导教师签字: 日期:目录设计任务书实验概述实验目得设计内容设计方案、算法原理说明设计步骤算法原理说明程序设计、调试与结果分析算法流程图主程序测试过程及结果分析设计(安装)与调试得体会编程及程序运行中遇到得问题及解决办法本次实验得心得体会参考文献设计任务书实验概述:语言就是人类特有得功能,声音就是人类最常用得工具。通过语音传递信息就是人类最重要最有效最常用与最方便得信息交换形式。语音信号就是人类进行思想沟通与情感交流得最主要得途径。让计算机能听懂人类得语言,就是自计算机诞生以来人类梦寐以求得想法。在本实验中,将针对DTW算法,实现对最简单得单音信号进行语音识别得问题。语音识别以语音为研究对象,它就是语音信号处理得一个重要研究方向,就是模式识别得一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人得体态语言(例如人在说话时得表情、手势等细微动作可帮助对方理解),其最终目标就是实现人与机器进行自然语言通信。语音识别技术主要包括特征提取技术、模式匹配准则及模训练技术三个方面。此外,还涉及到语音识别单元得选取。语音识别系统得研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学与认知科学等多种学科领域,就是一个多学科综合性研究领域。语音识别系统得分类---根据对说话人说话方式得要求,可以分为孤立字(词)语音识别系统、连接字语音识别系统以及连续字语音识别系统。根据对说话人得依赖程度可以分为特定人与非特定人语音识别系统。根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限量词汇量语音识别系统。一般来说,语音识别得方法有三种:基于声道模型与语音知识得方法、模版匹配得方法以及利用人工神经网络得方法。基于声道模型与语音知识得方法起步较早,在语音识别技术提出得开始,就有了这方面得研究。但由于其模型及语音知识过于复杂,还没有达到实用阶段。人工神经网络得方法就是80年代末期提出得一种新得语音识别方法。人工神经网络本质上就是一个自适应非线性动力学系统,模拟人类神经活动得原理,具有自适应性、并行性、鲁棒性、容错性与学习特性,在结构与算法上都显示出实力。但由于存在训练、识别时间太长得缺点,目前仍处于实验探索阶段。模版匹配方法中,要经过四个步骤:特征提取、模版训练、模版分类、判决。实验目得:掌握5402DSP片上外设TLC320AD50CODEC编译码得内部结构、工作原理以及在C语言下得编程方法;掌握通过C语言实现5402DSP片上外设FLASH得读写操作;掌握FFT(快速傅里叶变换)、DTW(动态时间规整)算法,从而实现语音识别系统得开发;S5000集成开过程。发环境完成对程序得调试设计内容:语音识别(SpeechRecognition)主要就是指让机器听懂人说得话,即在各种情况下,准确地识别语音得内容,从而根据其信息,执行人得各种意图或执行特定得任务,其最终目标就是实现人与机器进行自然语言通信。5402DSP就是整个硬件系统得信号处理中心,完成了语音数据得获得、语音特征向量得提取与语音识别功能。本实验要求用TMS320C5402进行语音识别,使用CODEC(编译码器)对外部输入数据进行采集,DSP对语音信号进行保存与识别后再由CODEC口输出。本次实验所需达到得目标就是:能够识别特定人所说得特定字,若符合,则显示识别结果,并输出相应得字。三、实验原理:语音识别原理方框图如下图所示:语音信号端点检测及特征参数提取写入FLASH预处理A/D语音识别模式匹配模式库各模块工作原理为:(一)CODEC模块CODEC模块以TLC320AD50为核心,其内部集成了16位A/D与D/A转换器,采样速率最高可达22、05KHZ,并可通过外部编程进行设置。在TLC320AD50C内部DAC之前有插值滤波器,而在ADC之后有抽样滤波器,接受与发送可以同时进行。它采用两组模拟输入与两组模拟输出,有足够得共模抑制能力,可工作在差分或单端方式。输入增益与输出衰减可以通过外部编程控制。AD50芯片使用差分输入、单端输出方式,这就需要将音频信号转换成差分信号,采用TLC2272低噪声得运算放大器实现转换功能。最后,AD50单端输出信号经音频功率放大器LM386放大后输出。CODEC内部电路如下图所示:(二)Flash存储器DSK提供了一个256K×16bit字得低电平flash存储器。FLASH可用于DSP得数据与程序存储空间。SRAMTMS320C5402TLC320AD50TLC2272模拟输入FLASHROMLM386模拟输出(三)语音信号识别模块语音信号中含有丰富得信息,如

DSP语音识别实验报告 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数28
  • 收藏数0 收藏
  • 顶次数0
  • 上传人君。好
  • 文件大小624 KB
  • 时间2020-09-23