下载此文档

基于支持向量机的音乐和弦识别的分析.doc


文档分类:论文 | 页数:约46页 举报非法文档有奖
1/46
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/46 下载此文档
文档列表 文档介绍
基于支持向量机的音乐和弦识别的分析.doc第一章绪论 1
1
2
3
4
第二章声学及音乐知识 6
6
6
7
7
8
9
、音程与和弦 10
11
第三章 音级轮廓特征提取 12
12
14
PCP特征介绍 14
15
PCP的优化 17
17
18
18
第四章音乐和弦识别系统的设计 19
19
19
20
HMM的定义描述 20
HMM的算法介绍 22
25
26
26
27
31
SVM的多类和弦分类 33
34
第五章总结与展望 37
37
38
参考文献 39
发表论文和参加科研情况说明 43
致 谢 44
第一章绪论

音乐是一种听觉意象,同时音乐也是艺术的一种表现形式,是人们抒发对现 实生活的一种认知。因此,音乐是人类表达情感信息的一种重要方式,也是人们 思想交流的重要组成部分。
在过去几十年中,随着计算机性能的优化、互联网技术的飞快发展以及多媒 体信息压缩/流媒体技术的革新,多媒体信息在互联网上的存储和发布也越来越 普遍。数字音乐信息属于多媒体信息的一部分,也呈现出快速增长的趋势⑴。因 此,为了能够有效组织和管理这些海量信息,人们对快速准确检索技术的需求变 得越来越迫切。现在社会上十分流行基于音乐内容检索的社交网络平台。标题、 标签和提供音乐歌曲的语义信息等技术被广泛应用到社区生成的音频语料库的 检索与分类中。然而这些生成的语料库通常是带有噪声的,因为使用者可能使用 了一些不完整或者是模棱两可,甚至是一些不相关的文本信息。因而如何能够为 社交网站提供一个更具鲁棒性的检索方法变得十分重要。当人工手动标记模糊不 清或者有所丢失时,通过直接搜索声乐内容则能够弥补可靠性标注的缺失,有助 于提高检索和挖掘多媒体音乐数据的质量⑵。
音乐信息检索技术的不断发展,促进了模式识别等智能信息处理技术在音乐 分析中的广泛应用。根据所需解决问题的不同性质,从样本类别是否已知的角度 分析,可以将对模式识别的研究可以分为有监督学习和无监督学习两个方向⑶。凡 是有监督的学习分类通常需要提供大量已知类别信息的样本,最具代表性的就 是已知训练数据的标签文件等。定义模式识别并不难,设计一套完善的系统才是 真正复杂的一项工作。
人们日常生活中比较熟悉的语音识别分类系统就属于一种典型的模式识别 系统。它涉及了包含信号与信息处理、模式识别、发声机理和听觉机理等众多交 叉学科领域。近年来,声纹识别技术不断发展,并且广泛用到了生物识别领域。 现在生物识别已经成为人们日常工作和生活中非常重要的一部分⑶。当前,语音 识别中最核心的技术就是采用连续隐马尔可夫模型对语音建模。使用该技术进行 语音识别时不仅识别速度快,而且识别的正确率也比较高。语音识别技术作为人 机交互的入口,随着移动互联网的不断发展与进步,语音技术将迎来其爆发式的 增长。目前来看,社会上已有多种分门别类的语音产品,并正在逐渐被人们所接
受。特别是语音信息检索与终端的完美结合,使得各种终端产品更加智能化。语 音识别技术的不断发展同时也带来了音乐信息检索技术的研究与发展。国外对音 乐信息检索技术的研究已初步取得了一些成果,包括歌曲哼唱系统的研发,乐谱 跟随器等。在我们国家,对于音乐信息检索这个领域的研究还很少,并且处于刚 刚起步的状态。因此,在移动互联网时代已经到来的今天,对音乐信息检索方面 的研究就越发重要。

现在很多针对音乐信息的检索技术一般都是通过对一些底层潜在信号特征 的分析来完成的,例如音频信号分析中常用梅尔倒谱系数MFCC (Mel-frequency Cepstral Coefficients),信号能量以及差分能量值等。虽然通过提取音频信号的 梅尔倒谱系数MFCC特征能够在一定程度上反映人耳的听觉特性,但是

基于支持向量机的音乐和弦识别的分析 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数46
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小健
  • 文件大小502 KB
  • 时间2021-07-19