语音编码与音频编码的区别

yangkiller 2008-06-14 05:07:20
音频文件有很多的文件格式,如我们所熟悉的mp3,wav,wma等等,每一种格式都是一种标准,而每一个标准都是有一定的编码算法组成的。那么语音编码中的每一个标准,如G.729,有对应的文件格式吗?低比特压缩后的语音保持成什么格式的文件?语音编码和音频编码所追求的目标有什么不同?
...全文
1222 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
iu_81 2008-06-14
  • 打赏
  • 举报
回复
看看协议
yangkiller 2008-06-14
  • 打赏
  • 举报
回复
G.729,有对应的文件格式吗?
iu_81 2008-06-14
  • 打赏
  • 举报
回复
语音编码就是对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并进行数字传输,语音编码的基本方法可分为波形编码和参量编码,波形编码是将时域的模拟话音的波形信号经过取样、量化、编码而形成的数字话音信号,参量编码是基于人类语言的发音机理,找出表征语音的特征参量,对特征参量进行编码。
1. 波形编码
波形编码是最简单也是应用最早的语音编码方法。最基本的一种就是PCM编码,如G.711 建议中的A 律或μ 律。APCM、DPCM和ADPCM也属于波形编码的范畴,使用这些技术的标准有G.721、G.726、G.727 等。波形编码具有实施简单、性能优良的特点,不足是编码带宽往往很难再进一步下降。
2. 预测编码
语音信号是非平稳信号,但在短时间段内(一般是30ms)具有平稳信号的特点,因而对语音信号幅度进行预测编码是一种很自然的做法。最简单的预测是相邻两个样点间求差分,编码差分信号,如G.721。但更广为应用的是语音信号的线性预测编码(LPC)。几乎所有的基于语音信号产生的全极点模型的参数编码器都要用到LPC, 如G.728、G.729、G.723.1 建议。
3. 参数编码
参数编码是建立在人类语音产生的全极点模型的理论上,参数编码器传输的编码参数也就是全极点模型的参数- 基频、线谱对、增益。对语音来说,参数编码器的编码效率最高,但对音频信号,参数编码器就不太合适。典型的参数编码器有LPC- 10、LPC-10E,当然,G.729、G.723.1 以及CELP(FS- 1016)等码本激励声码器都离不开参数编码。
4. 变换编码
一般认为变换编码在语音信号中作用不是很大,但在音频信号中它却是主要的压缩方法。比如,MPEG 伴音压缩算法(含著名的MP3) 用到FFT、MDCT 变换,AC- 3 杜比立体声也用到MDCT,G.722.1建议中采用的MLT 变换。在近年来出现的低速率语音编码算法中,STC(正弦变换编码)和WI(波形插值)占有重要的位置,小波变换和Gabor 变换在其中有用武之地。
5. 子带编码
子带编码一般是同波形编码结合使用,如G.722使用的是SB- ADPCM技术。但子带的划分更多是对频域系数的划分(这可以更好地利用低频带比高频带感觉重要的特点),故子带编码中,往往先要应用某种变换方法得到频域系数,在G.722.1 中使用MLT 变换,系数划分为16 个子带;MPEG 伴音中用FFT 或MDCT 变换,划分的子带多达32 个。
6. 统计编码
统计编码在图像编码中大量应用,但在语音编码中出于对编码器整体性能的考虑(变长编码易引起误码扩散),很少使用。对存在统计冗余的信号来说,统计编码确实可以大大提高编码的效率,所以,近年来出现的音频编码算法中,统计编码又重新得到了重视。MPEG 伴音和G.722.1 建议中采纳了哈夫曼变长编码。

15,440

社区成员

发帖
与我相关
我的任务
社区描述
C/C++ 非技术区
社区管理员
  • 非技术区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧