下载此文档

毕业论文-语音识别技术人工智能论文.doc


文档分类:IT计算机 | 页数:约15页 举报非法文档有奖
1/15
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/15 下载此文档
文档列表 文档介绍
一:前沿语音识别技术是 2000 年至 2010 年间信息技术领域十大重要的科技发展技术之一。它是一门交叉学科, 正逐步成为信息技术中人机接口的关键技术。语音识别技术与语音合成技术结合使人们能够甩掉键盘, 通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。二:语音识别技术概述语音识别技术,也被称为自动语音识别 Automatic Speech Recognition , (ASR) ,其目标是将人类的语音中的词汇内容转换为计算机可读的输入, 例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同, 后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合, 可以构建出更加复杂的应用, 例如语音到语音的翻译。语音识别技术所涉及的领域包括: 信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术, 语音识别技术一直受到各国科学界的广泛关注。如今, 随着语音识别技术研究的突破, 其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。 20 世纪 50 年代, 1952 年 Bel l 实验室开发的 Audry 系统是第一个可以识别 10 个英文数字的语音识别系统。 1959 年, Rorgie 和 Forge 采用数字计算机识别英文元音和孤立词, 从此开始了计算机语音识别。 60 年代, 苏联的 Matin 等提出了语音结束点的端点检测, 使语音识别水平明显上升; Vintsyuk 提出了动态编程,这一提法在以后的识别中不可或缺。 60 年代末、 70 年代初的重要成果是提出了信号线性预测编码(LPC) 技术和动态时间规整(DTW) 技术, 有效地解决了语音信号的特征提取和不等长语音匹配问题;同时提出了矢量量化(VQ) 和隐马尔可夫模型(HMM) 理论。 80 年代语音识别研究进一步走向深入: HMM 模型和人工神经网络(ANN) 在语音识别中成功应用。 1988 年, FULEE Kai 等用 VQ/I-IMM 方法实现了 997 个词汇的非特定人连续语音识别系统 SPHINX 。这是世界上第 1 个高性能的非特定人、大词汇量、连续语音识别系统。进入 90 年代后, 语音识别技术进一步成熟, 并开始向市场提供产品。许多发达国家如美国、日本、韩国以及 IBM 、 Apple 、 AT&T 、 Microsoft 等公司都为语音识别系统的实用化开发研究投以巨资。同时汉语语音识别也越来越受到重视。 IBM 开发的 ViaVoice 和 Microsof t 开发的中文识别引擎都具有了相当高的汉语语音识别水平。进入 21 世纪, 随着消费类电子产品的普及, 嵌入式语音处理技术发展迅速[2] 。基于语音识别芯片的嵌入式产品也越来越多, 如 Sensor y 公司的 RS C 系列语音识别芯片、 Infineo n 公司的 Unispeec h 和 Unilite 语音芯片等,这些芯片在嵌入式硬件开发中得到了广泛的应用。在软件上,目前比较成功的语音识别软件有:Nuance 、 IBM 的 Viavoice 和 Microsoft 的 SAPI 以及开源软件 HTK ,这些软件都是面向非特定人、大词汇量的连续语音识别系统。四. 国内研究历史及现状我国语音识别研究工作起步于五十年代, 但近年来发展很快。研究水平也从实验室逐步走向实用。从 1987 年开始执行国家 863 计划后,国家 863 智能计算机专家组为语音识别技术研究专门立项, 每两年滚动一次。我已经基本上与国外同步, 在汉语语音识别技术上还有自己的特点与优势, 并达到。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究, 其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。电子工程系语音技术与专用芯片设计课题组, 研发的非特定人汉语数码串连续语音识别系统的识别精度, 达到 94. 8% (不定长数字串)和 96. 8 %(定长数字串) 。在有 5 %的拒识率情况下, 系统识别率可以达到 96. 9%

毕业论文-语音识别技术人工智能论文 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数15
  • 收藏数0 收藏
  • 顶次数0
  • 上传人麒麟才子
  • 文件大小0 KB
  • 时间2016-06-25
最近更新