多媒体音频技术
音频信息处理
第一节声音的基本概念
声音是一连续的波,称为声波
声音的强弱体现在其振幅上,声音的音调的高低体现在声音的频率上
声音信号由许多频率不同的信号组成,是复合信号
声音的带宽:复合信号的频率范围例如高保真声音的频率范围为10Hz—20 000Hz,其带宽约为20KHz。
次音信号 0Hz—20Hz,音频信号20Hz—20KHz,话音信号 300Hz—3 000Hz,超音频信号:20KHz以上。
第二节声音信号的数字化
模拟信号与数字信号在时间和幅度上都是连续的信号称为模拟信号在时间和幅度上都是用离散的数字表示的信号称为数字信号
对模拟信号的处理比较复杂,难于精确控制,成本高。将模拟信号转换成数字信号,处理简单,精确。
声音信号的数字化
采样在某特定时刻对模拟信号进行测量叫采样每隔相等的一段时间进行采样,称为均匀采样
量化把信号幅度划分成若干小段,若每段都是相等的,称为线性量化,否则称为非线性量化。
采样频率采样频率即取样频率,指每秒钟取得声音样本的次数。采样频率越高,声音的质量也就越好。人耳的分辨率很有限,所以太高的频率就分辨不出来了;、、48KHz三个等级,,,48KHz则是DVD Audio或专业领域才会采用。根据奈奎斯特理论,采样频率不低于声音信号最高频率的两倍。这样就能把数字表达的声音还原成原来的声音,称为无损数字化。采样定律用公式表示为
fs ≥2f 或者 Ts ≤T/2其中f为被采样信号的最高频率。
采样(量化)精度样本大小是用每个声音样本的位数bit/s(即bps)表示的,它反映度量声音波形幅度的精度。
既用样本值的二进制位数来表示。位数越多精度越高,数据也越大。
第三节音频编码基础
音频编码分类音频编码的目的在于压缩数据。在进行压缩时,要在音频质量、数据量、计算复杂度三方面进行考虑。音频编码的分类如下:
基于音频数据的统计特性进行编码(波形编译码器) (其目标是使重建语音波形保持原波形的形状。如:PCM(脉冲编码调制)、DPCM(差分脉冲编码调制)、APCM(自适应脉冲编码调制)、ADPCM(自适应差分脉冲编码调制)
基于音频的声学参数,进行参数编码(音源编译码器)这类编码数据率低,但质量清晰度低。上述两种编码算法结合称为混合编码。
基于人的听觉特性进行编码
数据的压缩必然引起音频质量的降低。评价编码/解码器一般根据以下几个参数:音频质量、数据率、编码/解码延时和算法复杂度。
音频编码算法的评价
质量
采样频率
(kHz)
样本精度
(bit/s)
单道声/
立体声
数据率(kB/s)
(未压缩)
频率范围
电话*
8
8
单道声
8
200~3400 Hz
AM
8
单道声
FM
16
立体声
20~15 000Hz
CD
16
立体声
20~20 000 Hz
DAT
48
16
立体声
20~20 000 Hz
数字音频的质量与采样频率和量化精度有关。数字音频可分以下几个等级
声音质量的度量(用带宽度量)
声音质量和数据率
50~7 000Hz
电话质量
AM质量音乐 FM质量 CD质量
对于音频质量的评价分为客观评定和主观评定。客观评定是通过测量一些特性来评价度量,主要用信噪比(signal to niose ratio,SNR)。
广泛使用的是主观评定,以主观意见打分(Mean Opinion Score—MOS)来度量:
分数
质量级别
失真级别
5
优(Excellent)
无察觉
4
良(Good)
(刚)察觉但不讨厌
3
中(Fair)
(察觉)有点讨厌
2
差(Poor)
讨厌但不反感
1
劣(Bad)
极讨厌(令人反感)
声音质量的度量另外两种方法(主/客观评价)
MIDI是Musical Instrument Digital Interface的首写字母组合词,可译成“电子乐器数字接口”。用于在音乐合成器(music synthesizers)、乐器(musical instruments)和计算机之间交换音乐信息的一种标准协议.
MIDI是乐器和计算机使用的标准语言,是一套指令(即命令的约定),它指示乐器即MIDI设备要做什么,怎么做,如演奏音符、加大音量、生成音响效果等。MIDI不是声音信号,在MIDI电缆上传送的不是声音,而是发给MIDI设备或其它装置让它产生声音或执行某个动作的指令。
JAGUAR北京4S店开业庆典策划方案 来自淘豆网m.daumloan.com转载请标明出处.