分类号: UDC: 密级: 学校代号: 学号: 广东工业大学硕士学位论文(工学硕士) 11845 2111204078 服务机器人语音识别技术研究与实现谢杰腾指导教师姓名、职称: 塞I』渔塾拯学科(专业)或领域名称: 控剑型堂皇王猩学生所属学院: 自动丝堂医论文答辩日期: 窒Q堕生§旦窒Z旦万方数据 ADissertationSubmitted toGuangdong University of Technology for theDegree ofMaster (Master ofEngineering Science) Study and implementation on speech recognition based on theservice robots Candidate:Jieteng Xie Supervisor: liu May 2015 SchooI ofAutomation Guangdong University ofTechnology Guangzhou,Guangdong,,51 0006 哪4 嗍引㈣Y 万方数据摘要摘要近二十年来,语音识别技术取得很大的进步,逐渐从实验室走进市场中。专家预计,在未来10年内,.语音识别相关的技术将进入工业、家电、通信、汽车电子、医疗、消费电子产品等各个领域。虽然目前的语音识别技术取得了很大的进步,但是在较大词汇量、高实时性、系统消耗资源比较低和较高的识别率等方面还存在可很大的研究价值。在日常生活中,语音技术在控制服务机器人领域得到很大的应用和发展,研究语音控制服务机器人运动具有很大的价值和应用前景。本文介绍的语音控制系统就是应用语音识别技术来实现服务机器人的运动。首先,本文介绍了研究内容的相关的历史背景和国内外的研究现状,这其中包括分析了服务机器人运动控制、语音识别、语音端点检测和语音特征降维的研究现状。其次,本文介绍了对语音数据进行预处理的方法,主要包括语音信号的预加重、分帧、加窗和端点检测。本章提出了基于对数能量谱熵的端点检测方法,由于其计算简单可应用于中低端嵌入式平台,为后面将控制程序移植到安卓手机打下了基础。然后,本章介绍了提取语音的梅尔频率倒谱系数(Mel Frequency Cepstral Coefficiems, )的方法,为后面的语音识别提供有效的语音信号特征数据。第三,本章主要介绍了隐马尔科夫模型(HMM)的三个算法,比较了动态时问规整算法(Dynamic Time Warping,DTW)和隐马尔科夫模型(HMM)的优缺点。根据服务机器人语音控制系统的语音识别对象为非特定人的实际情况,本文选定隐马尔科夫模型(HMM)作为服务机器人语音控制系统的语音识别算法。第四,由于语音特征参数存在数据冗余、维数高的问题,导致隐马尔科夫模型训练时间长,本文通过用主成分分析法(ponent Analysis,PCA)对语音特征参数()进行降维。由于在大词汇量语音识别过程中,系统的计算量过大和占用内存过多从而导致识别时间过长,本文提出了基于k均值聚类分组算法, 此处对降维后语音特征参数()进行K均值聚类分组,从而得到稳定的分组特征参数。第五,本章介绍设计的服务机器人语音控制系统,该系统的开发是在eclipse平台上利用JAVA语言编程进行,第一部分主要是开发系统的控制界面,第二部分是开发语音数据处理和语音识别算法程序。万方数据广东工业大学硕士学位论文第六,在本章中介绍了算法的仿真和数据分析,并手动调试服务机器人语音控制系统。实验结果表明:提出基于对数能量谱熵的端点检测方法提高了端点检测的准确性。在保证准确率基本不变的情况下,通过对语音特征参数的PCA降维和语音模板分组,系统大大的减少了语音训练的时间,提高了语音识别的实时性,取得了良好的识别效果。本文在分析语音识别和服务机器人运动的前提下,深入研究了基于对数能量谱熵的语音端点检测方法、利用主成分分析对语音特征参数降维的方法和对降维后的数据利用K均值聚类进行分组方法。关键词:服务机器人;语音识别;端点检测;PCA;K均值聚类万方数据 ABSTRACT AB STRACT Inthe recent twenty years,speech recognition technology hasmade greatprogress and isgradually from the laboratory intothe predict that speech recognition technology will enter the filedsof industry,home appliances, communications,automotive e
服务机器人语音识别技术研究与实现 来自淘豆网m.daumloan.com转载请标明出处.