语音编码与音频编码的区别

yangkiller 2008-06-14 05:07:20

音频文件有很多的文件格式，如我们所熟悉的mp3,wav,wma等等，每一种格式都是一种标准，而每一个标准都是有一定的编码算法组成的。那么语音编码中的每一个标准，如G.729，有对应的文件格式吗？低比特压缩后的语音保持成什么格式的文件？语音编码和音频编码所追求的目标有什么不同？

...全文

1308 3 打赏收藏转发到动态举报

写回复

用AI写文章

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

iu_81 2008-06-14

打赏
举报

看看协议

yangkiller 2008-06-14

打赏
举报

G.729，有对应的文件格式吗？

iu_81 2008-06-14

打赏
举报

语音编码就是对模拟的语音信号进行编码，将模拟信号转化成数字信号，从而降低传输码率并进行数字传输，语音编码的基本方法可分为波形编码和参量编码，波形编码是将时域的模拟话音的波形信号经过取样、量化、编码而形成的数字话音信号，参量编码是基于人类语言的发音机理，找出表征语音的特征参量，对特征参量进行编码。
1. 波形编码
波形编码是最简单也是应用最早的语音编码方法。最基本的一种就是PCM编码，如G.711 建议中的A 律或μ 律。APCM、DPCM和ADPCM也属于波形编码的范畴，使用这些技术的标准有G.721、G.726、G.727 等。波形编码具有实施简单、性能优良的特点，不足是编码带宽往往很难再进一步下降。
2. 预测编码
语音信号是非平稳信号，但在短时间段内（一般是30ms）具有平稳信号的特点，因而对语音信号幅度进行预测编码是一种很自然的做法。最简单的预测是相邻两个样点间求差分，编码差分信号，如G.721。但更广为应用的是语音信号的线性预测编码（LPC）。几乎所有的基于语音信号产生的全极点模型的参数编码器都要用到LPC，如G.728、G.729、G.723.1 建议。
3. 参数编码
参数编码是建立在人类语音产生的全极点模型的理论上，参数编码器传输的编码参数也就是全极点模型的参数- 基频、线谱对、增益。对语音来说，参数编码器的编码效率最高，但对音频信号，参数编码器就不太合适。典型的参数编码器有LPC- 10、LPC-10E，当然，G.729、G.723.1 以及CELP（FS- 1016）等码本激励声码器都离不开参数编码。
4. 变换编码
一般认为变换编码在语音信号中作用不是很大，但在音频信号中它却是主要的压缩方法。比如，MPEG 伴音压缩算法（含著名的MP3）用到FFT、MDCT 变换，AC- 3 杜比立体声也用到MDCT，G.722.1建议中采用的MLT 变换。在近年来出现的低速率语音编码算法中，STC（正弦变换编码）和WI（波形插值）占有重要的位置，小波变换和Gabor 变换在其中有用武之地。
5. 子带编码
子带编码一般是同波形编码结合使用，如G.722使用的是SB- ADPCM技术。但子带的划分更多是对频域系数的划分（这可以更好地利用低频带比高频带感觉重要的特点），故子带编码中，往往先要应用某种变换方法得到频域系数，在G.722.1 中使用MLT 变换，系数划分为16 个子带；MPEG 伴音中用FFT 或MDCT 变换，划分的子带多达32 个。
6. 统计编码
统计编码在图像编码中大量应用，但在语音编码中出于对编码器整体性能的考虑（变长编码易引起误码扩散），很少使用。对存在统计冗余的信号来说，统计编码确实可以大大提高编码的效率，所以，近年来出现的音频编码算法中，统计编码又重新得到了重视。MPEG 伴音和G.722.1 建议中采纳了哈夫曼变长编码。