第二章数字音频处理 数字音频技术基础知识 声音的基本概念声音是由空气中分子振动而产生的,是一个随时间变化的连续信号。做简谐振动的发声体发出的声音是纯音,也称单音。纯音一般只能由专用设备产生,波形可以近似地看成一种周期性的函数。单音波形自然界的声音、乐器发出的声音,一般是由若干个频率和振幅都不同的纯音所组成的复音。复音中频率最低的纯音称基音,它是决定音调的基本要素。复音中存在的其他频率是复音中的次要成分,称为谐音。基音和谐音合成复音,决定了特定的声音音质和音色。复音波形声音有三要素分别是: 响度,音调,音色。响度又称音量,表示声音能量的强弱程度,大小主要取决于声音接收处的声波振幅,单位用分贝(db) 表示。人耳感受到的声音强弱,是人对声音大小的一个主观感觉量。就同一声源来说,波幅传播的愈远,响度愈小;当传播距离一定时,声源振幅愈大,响度愈大。当声音的频率、声波的波形改变时,人对响度大小的感觉也将发生变化。声音的高低叫做音调,表示人耳对声音调子高低的主观感受。音调的高低主要取决于声波频率的高低, 单位用赫兹(Hz) 表示,频率高则音调高,频率低则音调低。通常自然界和乐器发出的声波都是复音,波形复杂,所以音调的高低,实际由很多因素所决定。音色又称音品,表示声音的品质,音色由声音波形的谐波频谱和包络决定。复音中包括基音和泛音。基音的频率最低,由发音体全段振动产生,泛音由发音体各部分振动产生。每个复音都包括有固有音调的基音以及不同频率和响度的泛音,通过不同的泛音可以区别其它具有相同基音的的复音,形成独特的音色。 波形音频计算机中处理的信息必须是二进制数字。所以计算机要处理声音,必须先将声音数字化。声音的数字化过程涉及采样、量化和编码三个过程。采样指每隔一个时间间隔在声音的波形上截取一个振幅值,把时间上的连续信号变成时间上的离散信号。该时间间隔 T称为采样周期,其倒数 1/T 称为采样频率。采样频率越高,采样的间隔时间越短,在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确,声音的质量就越好,声音文件占用的存储空间也越大。常用的采样频率有: 、 、 等。量化指把在幅度上连续取值的每一个样本转换为离散值表示,就是将采样得到的声波上的幅度值数字化。量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的采样值归为一类,并赋于相同的量化值。采样信号的量化值采用二进制表示,表示采样信号的幅度二进制数的位数称量化位数。在相同的采样频率之下,量化位数愈高,测量的采样值就越精确, 声音的质量越好,声音文件占用的存储空间也越大。声音信号的量化精度一般为 8bit , 12bit , 16bit 。编码指按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有效的数据中加入一些用于纠错、同步和控制的数据。音频信号编码通常采用的是波形编码方法,它直接对波形采样、量化和编码, 算法简单,易于实现,在声音恢复时能保持原有的特点,因此被广泛应用。常用的声音编码格式有: PCM 编码方法、 DPCM 编码、 ADPCM 压缩编码等。除了采样、量化、编码外,影响声音数字化效果的另一个重要因素是声道。声道指声音的通道数,是一次采样记录产生的声音波形的个数。记录声音时, 如果每次生成一个声道数据,称为单声道;每次生成两个声道数据,称为双声道。立体声音乐能使听众获得身临其境的感觉就是使用双声道的效果。随着声道数的增加,声音文件的存储容量也会成倍增加。
多媒体技术 来自淘豆网m.daumloan.com转载请标明出处.