mp3PRO 的 Spectral Band Replication 技术详细介绍

作者:Sender  来源:WaveCN.com  发布日期:2005-11-21  最后修改日期:2008-02-15

1. 介绍

  低比特率音频编码技术是诸如数字广播,互联网电台和移动多媒体等多种行业应用的启动技术。

  目前,基于地面站或卫星的数字无线电系统所能提供的整体带宽是十分有限的。因此,数字化广播行业需要通过低 比特率的音频通道去为听众创造合意的吸引的节目。因此,系统设计者必须在低比特率下使用高效的感知音频编码器(比如mp3或者AAC技术)。

  在互联网流应用上,网络电台服务器和听众的客户应 用程序之间的连接带宽实际取决于听众是以什么方式接入互联网的。在今天大多数情况下,人们在相当有限的数据率下使用模拟信号的调制解调器或ISDN线路, 这些接入方式能提供的比特率要比各种常见的感知音频编码器产 生的可接受的音频质量的比特率要低得多。

  即使客户通过高带宽连接,例如xDSL方式来连接到互联网,也因受到互联网上的常见的拥挤堵塞现象影响而限制了这些连接的稳定性,即连接能否在较长时间内持续提供一个稳定的连接比特 率。

  移动通信方面的情况与数字化广播相似。这因为可用于所有服务的整体带宽在一个特定地理范围(一个网络单元) 是有限的,网络运营商务必采取措施允许尽可能多的用户在某个网络单元使用实际是并行的移动通信服务。

  很显然,基于商业上的考虑,网络运营商必须保证他们通过依靠各种高效的语音和音频编码来尽可能有效地使用可用的频带。鉴于多 媒体服务的到来对移动通信系统的数据率需求造成了影响,即使立即应用基于UMTS结构的新一代移动通信系统,蜂窝网络也只能在 相当低的数据率下使用感知编码。

2.技术挑战

  在低比特率下使用感知编码,不能不考虑其实际表现能力。艺术级的感知音频编码在大约128 kbps (~12:1压缩率)可达到“CD质量”或“清晰的”音频质量。

  在低于128kbps时,听众可感觉到大多数编码技术产生的音频质量有了明显的下降。编码器要么开始减少音频带宽并修正(通常是收窄)立体声的映像,要么就只能意图通 过不足够的比特数来重现完整的音频带宽,同时导致在音频中引入讨厌的编码噪音(coding artifacts)。

  上述两种修正感知声音的方法在一定程度上是不可接受的。例如64kbps的mp3就只能提供大约10KHz的音频带宽,否则便会引入一定数量的编码噪音(coding artifacts)。每一种因素都会直接影响到收听的体验效果。



3. 技术方案

  SBR(频带重现 Spectral Band Replication)是一种全新的音频编码增强工具,并已经在ISO/IEC 14496-3:2001/Amd.1:2003中被标准化。它提供了改善低比特率音频和语音编码音质的可能性,这是通过增加在特定比特率的音频带宽或改善在特定质量水平的编码效率而实现的。

  SBR可以扩大传统感知编码在低比特率下所能提供的有限的音频带宽,因此的性能表现它相当于或超过模拟FM音的频带宽(15kHz)。SBR也可以改善窄带语音编码的质量,可为广播电台提供12kHz音频带宽的纯语音频道,可用如诸如多语言广播等场合。

   由于大多数语音编码都是被严格地限制带宽的,因此SBR的重要性不仅体现在提高语音质量上,而且也体现在提高语音的可读性和理解性上。SBR是以后处理为主的,不过为能指导解码过程,在编码时编码器要先做一些预处理工作。

  从技术角度而言,SBR是在音频压缩算法中的一种实现高效高频率的编码新方法。当联合SBR一起使用,其主体编码器(比如mp3)只负责处理音频频谱的低频部分。

  高频部分则由SBR解码器产生,这是紧跟在传统波形解码器之后的一个后处理过程。SBR基于对主体编码器处理得到的低频信号进行的分析,在解码器上重建了高频部分。为了确保精确的重建,一些指导信息以非常低的数据率夹杂在主体编码器产生的码流中一同传输。

  重建对于和声和噪声成分同样有效,同时允许在频率范围和时间范围进行适当的修整。结果是,SBR实现了在非常低数据率下的全带宽音频编码,与主体编码器相比,明显地增加了压缩效率。

4. 性能

  SBR可以改善感知音频编码的效率,在中等至低比特率下能提高大约30%(在某些特定情况下可能更高)。SBR具体能够提供的改善程度同时也依赖于其主体编码器。

  举例说,联合mp3一起使用SBR(参考mp3PRO相关文章),我们可以在64kbps下达到相对传统的大于100kbps的立体声mp3的音频质量。SBR可应用于单声道,立体声甚至多声道的音频。

  因此,可以说,SBR在主体编码器本身可编码的音频信号比特率范围和在有限的音频带宽下的可接受的编码噪音 (coding artifacts)水平内提供了最大的效率。


未经许可,不得转载。

本栏目相关
  •  2008-11-10 Linux 音频 API 指南
  •  2007-04-03 基于WaveX低级音频函数的实时语音通信
  •  2001-09-13 Graph Editor 教程
  •  2001-09-20 Ogg Vorbis测试报告
  •  2005-11-27 Parametric Stereo/参量立体声简介
  •  2005-11-26 MPEG 1 Layer-2+SBR对比MPEG 1 Layer-2
  •  2005-12-16 Fraunhofer IIS 音频水印技术
  •  2006-05-03 什么是ABX盲听测试
  •  2001-06-28 老技术的新生命:mp3PRO
  • 微信订阅号二维码

    本页网址二维码: