MPEG-4 音频无损编码:MPEG-4 Audio Lossless Coding (ALS)

作者:Sender Su  来源:原创内容  发布日期:2008-03-11  最后修改日期:2008-03-11

MPEG Logo
原文链接:http://www.nue.tu-berlin.de/forschung/projekte/lossless/mp4als.html


目录

无损编码是MPEG-4音频标准的最新扩展。MPEG 音频工作小组已经最终完成了专用于高保真音频信号的无损编码技术标准的制定过程。作为MPEG-4音频的扩展,MPEG-4 音频无损编码(MPEG-4 Audio Lossless Coding (ALS))标准定义了无损编码的方法。MPEG-4 ALS的基础技术是由 Technical University of BerlinNUe Group (Fachgebiet Nachrichtenübertragung)所研发。该标准也已经被国际标准化组织(ISO,www.iso.org)接纳成为标准: ISO/IEC 14496-3:2005/Amd 2:2006

MPEG-4 ALS 的特性

MPEG-4 ALS 同时面向专业应用和消费应用而定义了高效、快速的无损音频压缩技术。它提供了许多其它无损压缩方案所缺乏的特性:

  • 对几乎所有未压缩数字音频格式的通用性支持,包括wav、aiff、au、bwf以及raw格式;

  • 支持PCM格式音频最大采样位数32位以及任意采样频率的任意组合,包括最常见的 16位/44.1kHz、16位/48kHz、24位/48kHz、24位/96kHz和24位/192kHz;

  • 支持多声道/多音轨,最高支持65536个声道,包括5.1环绕方式;

  • 支持32位IEEE浮点数音频数据;

  • 可快速地随机访问已编码数据的任何部分;

  • 可选择以MP4文件格式保存,支持与视频复合。

  • 高度灵活的编解码参数,可适应各种场合的应用。

除了这些出众的特性之外,一个全球化的MPEG无损音频编码标准可促进不同的硬件和软件平台之间的最大互操作性。因而, 该标准可望得到行业内长期的支持。

什么是“无损”编码?

无损音频编码技术可对数字音频数据进行压缩,并可完美地重现原来的声音且不会对音频质量造成任何损失。这是一个专业应用和消费应用都高度感兴趣的话 题。现在的有损压缩编码,比如MP3或者AAC,可在对音频进行高压缩比的编码,同时能保证对聆听者相对透明的主观音频质量。但这些编码并不会保留原始音 频数据的每一个比特。因此,有损编码方式不适合于编辑或存档应用,因为多次的编码或反复的后处理会暴露那些原本被有损压缩编码技术掩盖起来的失真。

应用无损熵编码方式,比如Lempel-Ziv(基本上等于ZIP文件的压缩技术)、Huffman编码或其他算术编码 到音频信号并不会获得好的效率。主要是因为音频信号之间的持续相关性和音频信号采样值的范围宽广(导致基于字典方式的压缩算法难以形成有效的字典而进行数 据压缩)。因此,传统的数据压缩工具,比如Winzip或者gzip对数字音频数据都没有效果。

但是,若果通过去除信号中的统计学依赖性而获得信号的去相关状态,则该状态可视为一种几乎是完全无关联的信号源从而易于 编码。为达到这样的去相关状态,常见的方法是使用线形预测。进行线性预测时,原始音频信号的每一个样本都是从前一个样本预测得到的。原始信号和预测信号之 间的差别被称为剩余信号。如果预测工作得好,剩余信号便是一种无关联的信号,其值的范围将比原始值小得多。剩余信号通常以简单熵编码方式进行编码。常见的 一种简单熵编码方式是Rice代码,它是Huffman编码的一种特殊情况。

上图显示了简单的无损编码器工作流图。图中使用了线性预测编码(LPC)和熵编码。对应的解码器如下图:

LPC合成滤波器所做的事情基本上就是把杯之前的分析滤波器所去除的依赖性重新加入到信号中。也就是说,它使信号互相之 间再次关联起来,从而无损地重构原始数据。虽然分析滤波器和和合成滤波器的组合通常不是无损的,但只要遵守一些基本的条件便可实现无损处理。

应用

在专业和消费应用上,无损音频编码的通常用途和MPEG-4 ALS的特定用途包括:

  • 音频档案系统,包括广播、音乐工作室、录音间、图书馆等场合;

  • 音乐工作室内部的音频处理,包括存储、协作处理、数字化传输;

  • 高分辨率的碟载格式;

  • 通过互联网分发音频文件;

  • 在线音乐商店(下载)

  • 便携式音乐播放器

对于在线音乐商店的情况,以有损压缩格式,诸如MP3、AAC或者WMA格式下载最新的CD将不会受限制。取而代之的 是,消费者可以购买具有完全CD质量的音轨,而这些音轨仍然是压缩的,见下图:

更有甚者,MPEG-4 ALS可不仅限于用于压缩音频信号。它可以用来压缩其他格式信号,比如医学数据(ECG, EEG)或地震学数据。

历史

2002年7月,MPEG向外界号召征集提交无损音频编码技术的方案。该号召支持两种不同的目标:一是由有损压缩核心编码(比如MPEG-AAC) 和无损压缩增强层组成的分级系统,二是纯粹的无损压缩编码。在2002年12月,7家公司各自提交了一个或多个可满足基本需求的方案。接下来,这些提交的 方案都经过了压缩效率、复杂度和灵活性的评估。在2003年3月,音频分组决定首先进行纯粹无损压缩编码的标准化进程,同时对分级系统进行更深入的研究。 由于Technical University of Berlin(TUB)提交的纯无损编码方案在所有方案中具有最高的压缩比,于是被选作参考模型。同时,TUB、RealNetworks和NTT对原始 方案进行多处的改进和扩展,最终在2005年7月形成了MPEG-4 ALS的最终规格,并被国际标准组织接纳成为标准ISO/IEC 14496-3:2005/Amd 2:2006 Audio Lossless Coding (ALS), new audio profiles and BSAC extensions

出版物

T. Liebchen, T. Moriya*, N. Harada*, Y. Kamamoto*, Y. Reznik**
*NTT Communication Science Labs, **RealNetworks Inc.
The MPEG-4 Audio Lossless Coding (ALS) Standard - Technology and Applications
119th AES Convention, New York, October 7-10, 2005.

T. Liebchen, Y. Reznik*
*RealNetworks Inc.
Improved Forward-Adaptive Prediction for MPEG-4 Audio Lossless Coding
118th AES Convention, Barcelona, May 28-31, 2005.

T. Liebchen
An Introduction to MPEG-4 Audio Lossless Coding
IEEE ICASSP 2004, Montreal, May 2004.

T. Moriya*, D. Yang**, T. Liebchen
*NTT Cyber Space Labs, **University of Southern California
Extended Linear Prediction Tools for Lossless Audio Coding
IEEE ICASSP 2004, Montreal, May 2004.

D. Yang*, T. Moriya*, T. Liebchen
*University of Southern California, **NTT Cyber Space Labs, 
A Lossless Audio Compression Scheme with Random Access Property
IEEE ICASSP 2004, Montreal, May 2004.

T. Liebchen, Y. Reznik*, T. Moriya**, D. Yang***
*RealNetworks Inc., **NTT Cyber Space Labs, ***University of Southern California
MPEG-4 Audio Lossless Coding
116th AES Convention, Berlin, May 2004.

T. Moriya*, D. Yang**, T. Liebchen
*NTT Cyber Space Labs, **University of Southern California
A Design of Lossless Compression for High Quality Audio Signals
18th International Congress on Acoustics, Kyoto, April 2004.

T. Liebchen, Y. Reznik*
*RealNetworks Inc.
MPEG-4 ALS: An Emerging Standard for Lossless Audio Coding
IEEE Data Compression Conference, Snowbird, USA, March 2004.

T. Liebchen
MPEG-4 Lossless Coding for High-Definition Audio
115th AES Convention, New York, October 2003.

T. Liebchen
Lossless Audio Coding Using Adaptive Multichannel Prediction
Convention Paper 5680, 113th AES Convention, Los Angeles, 2002.

P. Noll, T. Liebchen
Digital Audio: From Lossless to Transparent Coding
Proceedings IEEE Signal Processing Workshop, Poznan, pp. 53-60, 1999.

WG11 和 MPEG 文档

Documents related to MPEG-4 ALS are available here
(大多数文档仅限MPEG成员,需要密码访问)

软件下载

ALS 参考软件

最新版本的MPEG-4 ALS参考软件与其他一些MPEG-4参考软件一道被包含在文档N8322中,自2006年9月22日可用。N8322会被发布于MPEG主页。由于全 部的参考软件打包后超过12MB,因此这里给出仅包含ALS的部分(被包含在文档N8175中的上一版本)供下载。

已编译的编解码器已经包含在ALS参考软件中。MPEG成员可从ftp://ftlabsrv.nue.tu-berlin.de/mp4lossless(需 要密码访问)下载所有版本的参考软件。

Winamp 插件

Winamp 的ALS插件是基于最新的参考软件而成,可播放由参考编码器生成的所有文件(文件扩展名必须为.als)。若希望能使用快速定位操作,文件应采用随机访问 点方式进行编码,即使用编码参数-r,并建议和参数-u1一同使用。

解压后把文件“in_mp4als.dll”复制到Winamp的安装目录下的Plugins目录中便可。

相关链接

关于无损音频编码的更多信息可以在以下网址获得:

关于MPEG的更多信息:

本栏目相关
  •  2009-03-21 mp3的无损版本:mp3HD已经推出!
  •  2008-03-31 最流行的无损压缩格式 - FLAC 系列之二:FLAC格式应用
  •  2008-03-11 MPEG-4 音频无损编码:MPEG-4 Audio Lossless Coding (ALS)
  •  2008-04-02 最流行的无损压缩格式 - FLAC 系列之三:关于FLAC的常见疑问
  •  2008-04-03 最流行的无损压缩格式 - FLAC 系列之四:评测和比较
  •  2008-03-24 来自俄罗斯的无损音频压缩编码:True Audio (TTA)
  •  2008-03-17 LA - LosslessAudio 无损音频编码及无损压缩原理介绍
  •  2008-03-26 最流行的无损压缩格式 - FLAC 系列之一:FLAC格式介绍
  •  2008-03-13 无损音频压缩:OptimFROG
  • 本站微信订阅号:

    微信订阅号二维码

    本页网址二维码: