mp3PRO 的 Spectral Band Replication 技术详细介绍

作者：Sender Su 来源：原创内容发布日期：2005-11-21 最后修改日期：2008-02-15

1. 介绍

　　低比特率音频编码技术是诸如数字广播，互联网电台和移动多媒体等多种行业应用的启动技术。

　　目前，基于地面站或卫星的数字无线电系统所能提供的整体带宽是十分有限的。因此，数字化广播行业需要通过低比特率的音频通道去为听众创造合意的吸引的节目。因此，系统设计者必须在低比特率下使用高效的感知音频编码器（比如mp3或者AAC技术）。

　　在互联网流应用上，网络电台服务器和听众的客户应用程序之间的连接带宽实际取决于听众是以什么方式接入互联网的。在今天大多数情况下，人们在相当有限的数据率下使用模拟信号的调制解调器或ISDN线路，这些接入方式能提供的比特率要比各种常见的感知音频编码器产生的可接受的音频质量的比特率要低得多。

　　即使客户通过高带宽连接，例如xDSL方式来连接到互联网，也因受到互联网上的常见的拥挤堵塞现象影响而限制了这些连接的稳定性，即连接能否在较长时间内持续提供一个稳定的连接比特率。

　　移动通信方面的情况与数字化广播相似。这因为可用于所有服务的整体带宽在一个特定地理范围（一个网络单元）是有限的，网络运营商务必采取措施允许尽可能多的用户在某个网络单元使用实际是并行的移动通信服务。

　　很显然，基于商业上的考虑，网络运营商必须保证他们通过依靠各种高效的语音和音频编码来尽可能有效地使用可用的频带。鉴于多媒体服务的到来对移动通信系统的数据率需求造成了影响，即使立即应用基于UMTS结构的新一代移动通信系统，蜂窝网络也只能在相当低的数据率下使用感知编码。

2.技术挑战

　　在低比特率下使用感知编码，不能不考虑其实际表现能力。艺术级的感知音频编码在大约128 kbps (~12:1压缩率）可达到“CD质量”或“清晰的”音频质量。

　　在低于128kbps时，听众可感觉到大多数编码技术产生的音频质量有了明显的下降。编码器要么开始减少音频带宽并修正(通常是收窄)立体声的映像，要么就只能意图通过不足够的比特数来重现完整的音频带宽，同时导致在音频中引入讨厌的编码噪音(coding artifacts)。

　　上述两种修正感知声音的方法在一定程度上是不可接受的。例如64kbps的mp3就只能提供大约10KHz的音频带宽，否则便会引入一定数量的编码噪音(coding artifacts)。每一种因素都会直接影响到收听的体验效果。

3. 技术方案

　　SBR（频带重现 Spectral Band Replication）是一种全新的音频编码增强工具，并已经在ISO/IEC 14496-3:2001/Amd.1:2003中被标准化。它提供了改善低比特率音频和语音编码音质的可能性，这是通过增加在特定比特率的音频带宽或改善在特定质量水平的编码效率而实现的。

　　SBR可以扩大传统感知编码在低比特率下所能提供的有限的音频带宽，因此的性能表现它相当于或超过模拟FM音的频带宽（15kHz)。SBR也可以改善窄带语音编码的质量，可为广播电台提供12kHz音频带宽的纯语音频道，可用如诸如多语言广播等场合。

　　由于大多数语音编码都是被严格地限制带宽的，因此SBR的重要性不仅体现在提高语音质量上，而且也体现在提高语音的可读性和理解性上。SBR是以后处理为主的，不过为能指导解码过程，在编码时编码器要先做一些预处理工作。