微信订阅号二维码
本栏目热门内容
  • 全格式自动改名器 Ver 4.0...
  • mp3的无损版本:mp3HD已经...
  • Ogg Theora 1.0 发布
  • 继Opera之后,Firefox(Ge...
  • Linux 音频 API 指南
  • Module音乐大全
  • 常见疑问(FAQ)
  • WaveCN 教程
  • 发现一个德国人做的音频网...
  • Rockbox Utility介绍及Roc...
  • 基于WaveX低级音频函数的...
  • 最流行的无损压缩格式FLAC...
  • 安装使用WaveCN
  • 音频制作与编辑初级教程节...
  • 如何用WaveCN录制自己的音...
  • Rockbox系列三:关于 Rock...
  • MPEG-4 音频无损编码:MPE...
  • Rockbox 3.0 释出。
  • Rockbox系列一:开源的Roc...
  • 音频文件格式全介绍
  • 音频术语中常见的“采样频...
  • WaveCN 运行截图
  • Windows 播放音频文件音量...
  • 最流行的无损压缩格式FLAC...
  • 来自俄罗斯的无损音频压缩...
  • Graph Editor 教程
  • LA - LosslessAudio 无损...
  • 最流行的无损压缩格式FLAC...
  • Rockbox系列二:Rockbox具...
  • 更多...

    关于MPEG知觉音频编码的基础知识
    作者:Sender  来源:WaveCN.com  发布日期:1999-04-11  最后修改日期:2008-02-15

     

    介绍


      围绕着音频压缩,音频编码和音频解码这些名词有着大量的混乱。这一章节可以在音频译码(又一个这样的名词)是关于什么的这个问题上给你一个总览。

    返回目录
     

    音频压缩的意图

      在音频压缩出现之前,高质量的数字音频数据要占据大量的硬盘空间去储存(或通道带宽去传输)。

      让我们来看看一个很短的例子。你想对你喜欢的一分钟歌曲进行采样并储存到你的硬盘上。因为你想要CD质量,所以你以44.1KHz的采样频率,立体声,每个采样值16比特的方式进行采样。

      44.1KHz意味着每秒钟有44100个采样值从你的声音卡(或输入文件)里出来。乘以2是因为你有两个通道。再乘以2是因为每个采样值有两个字节(这是16比特的意思)。那首歌总共会占据:

    44100 (样本值/秒) * 2(两个通道)* 2(每样本值两个字节)*60(每分钟60秒) =10584000 (字节)

    即大约10MBYTES的硬盘空间。如果你想从INTERNET上下载这首歌的话,使用一个普通的28.8KBPS的MODEM,将会用你:
    10584000(字节)* 8(8比特/每字节)/(28800(比特/每秒)* 60(秒/每分钟)) = 49 分钟

    即至少要49分钟,还没有算上传输开销和线路不畅,才仅能下载一分钟的立体声音乐!

      数字音频编码,在本文里,也称为数字音频压缩,是减少音频数据所需的存储空间(或通道带宽)的艺术。现代知觉音频编码技术(象MPEG LAYER-3或MPEG-2AAC)开拓了人类耳朵的特性(对声音的知觉)而获得大约1:12的压缩率而只有很少或根本没有感觉得到的音质损失。

      因而,这样的机制对于高质量低比特率应用来说是关键技术,象CD-ROM游戏的音轨,固化声音存储体,INTERNET音频,数字音频播放系统诸如此类等。

    返回目录
     

    音频压缩的两个部分

      音频压缩实际上由两个部分组成。第一部分,称为编码,把存放在波形文件里的数字音频数据转换为高度压缩的形式,称为比特流(或者叫已编码音频数据)。要在你的声音卡上播放比特流时,你需要第二部分,称为解码。解码把比特流重建为波形文件。

    返回目录
     

    它是怎样工作的?

      最高的编码效率是通过开发信号冗余(exploiting signal redundancies)和基于人类听觉系统模式的频域不相关(irrelevancies in the frequency domain)算法而赢得的。

      所有的编码器使用相同的基本结构。编码机制可以描述为“知觉噪音成型”(perceptual noise shaping)或“知觉边带/变换编码”(perceptual subband / transform coding)。编码器通过计算滤波器段(filterbank)分析音频信号的频谱组成并应用精神听觉(psychoacoustic)模式来估计仅仅可以注意得到的噪音电平。在其量化和编码阶段,编码器尝试分配尽可能的数据比特位数以同时满足比特率和屏蔽要求。

      解码器的复杂程度少的多。它唯一的任务是从已编码的频谱成分中把音频信号合成出来。

      所有的“层”使用同样的分析滤波器段(filterbank)(多相的且具有32个边带)。层-3增加了一个MDCT转换去增强频率的分辨率。

    返回目录
     

    压缩率,比特率和质量


      一直以来都没有明确地指出过:当你编码然后再解码而得到的东西跟你原来的声音文件并不一样!或者说,所有多余的东西(更加准确的说:多余的和不相关的声音信号部分)都已经压榨掉了。重建后的WAVE文件与原来的WAVE文件不同,但听起来一样——或多或少,与应用了多大压缩率于其上有关。

      因为压缩率是比较难以测量,专家们在谈及压缩的强度时使用术语比特率。比特率表示一秒的声音数据会消耗的平均BITS的数量。这里的通常单位是KBPS,即每秒1000 BITS.

      在CD上的数字音频信号,比特率是1411.2KBPS。使用了MPEG-2ACC,如同CD音质的声音质量可以达到96KBPS的比特率。

    返回目录

    - THE END -

    欢迎关注微信公众号后私信讨论文章内容!
    本栏目相关
  •  2008-03-11 MPEG-4 音频无损编码:MPEG-4 Audio Lossless Coding (ALS)
  •  2003-01-28 更丰富的网络媒体流感受,来自Windows Media 9
  •  2006-02-09 环绕MP3官方介绍
  •  2005-11-26 MPEG 1 Layer-2+SBR对比MPEG 1 Layer-2
  •  2005-11-27 Parametric Stereo/参量立体声简介
  •  2005-12-16 Fraunhofer IIS 音频水印技术
  •  2001-04-28 Windows Media 一统天下?
  •  2008-03-10 Xiph.Org 2007年总结
  •  2001-06-28 老技术的新生命:mp3PRO