微信订阅号二维码
本栏目热门内容
  • 全格式自动改名器 Ver 4.0...
  • mp3的无损版本:mp3HD已经...
  • Ogg Theora 1.0 发布
  • 继Opera之后,Firefox(Ge...
  • Linux 音频 API 指南
  • Module音乐大全
  • 常见疑问(FAQ)
  • WaveCN 教程
  • 发现一个德国人做的音频网...
  • Rockbox Utility介绍及Roc...
  • 基于WaveX低级音频函数的...
  • 最流行的无损压缩格式FLAC...
  • 安装使用WaveCN
  • 音频制作与编辑初级教程节...
  • 如何用WaveCN录制自己的音...
  • Rockbox系列三:关于 Rock...
  • MPEG-4 音频无损编码:MPE...
  • Rockbox 3.0 释出。
  • Rockbox系列一:开源的Roc...
  • 音频文件格式全介绍
  • 音频术语中常见的“采样频...
  • WaveCN 运行截图
  • Windows 播放音频文件音量...
  • 最流行的无损压缩格式FLAC...
  • 来自俄罗斯的无损音频压缩...
  • Graph Editor 教程
  • LA - LosslessAudio 无损...
  • 最流行的无损压缩格式FLAC...
  • Rockbox系列二:Rockbox具...
  • 更多...

    自我音乐,自己动手 - 如影随形,我的音乐 - 压缩 / 转换篇
    作者:Sender  来源:《新电脑》杂志约稿,发表于2005年3月号  发布日期:2005-03-01  最后修改日期:2008-02-14

      随身一个播放器,音乐便可常伴左右,带给我们舒畅的感觉。但选择那种压缩音频格式才有好的效果,用什么制作软件才更直接方便,也是一件重要的事情。

      现在最流行压缩音频格式当然就是已经有十年历史的 mp3 格式了。没有那一个播放器不支持播放 mp3 格式的音乐文件。这是 mp3 格式最大的优点。但由于 mp3 的技术太旧,所以在众多压缩格式中它的音质是最差的。为达到更好的保真度,现在通常都把音乐压缩为 VBR 方式的 mp3 文件。所谓 VBR 方式是让编码器根据被处理的音乐的特点自动为音乐中的每一个片断选择一个合适的压缩比例,达到高品质的同时又能保持一定的压缩率。但 VBR 方式的 mp3 在便携播放器上播放可能存在问题,最常见的情况是歌曲的长度显示错误,或者播放中会出现跳跃的情况。要压缩 mp3 ,目前最好的软件是 LAME 。 LAME 是一个开放源代码的免费软件,命令行界面,通常需要一些称为“前端”的软件来配合使用以增加易用性。比如 RazorLame 就是一个不错的前端。类似的还包括 WinLamer 等。

      mp3 技术也不是一成不变的。研发 mp3 技术的 Fraunhofer-IIS 研究所在原来 mp3 的基础上也作了一些改进,比如与 CodingTechnologies 合作开发的 mp3PRO 技术,着重还原了 mp3 格式最缺乏的高音部分。并不是所有的播放器(无论是软件的还是硬件的)都支持 mp3PRO 技术,幸好 mp3PRO 是一种向下兼容的技术,在不支持的播放器上至少还能把 mp3PRO 文件作为普通的 mp3 文件来播放。当然,这种情况下的播放效果就是两回事了。

      另一个正在不断上升的压缩音频格式就是微软公司推出的 Windows Media 。经过微软公司的不断耕耘之后 Windows Media 终于在版本 9 得到用户认可,开始获得广泛使用。 Windows Media 9 的特点是可以提供全类型的音乐压缩方案:有损压缩、无损压缩以及面向语音的压缩都同时提供。市场上也有部分播放器可以支持播放 WMA 文件,但是否能支持所有的压缩方式就不得而知。

      开放源码方面的 Ogg Vorbis 由于进展一直都比较缓慢,一度几乎被遗忘。但由于 mp3 格式的发明人宣布对 mp3 压缩器和播放器都一律征收版权费,使世人又重新给予 Ogg Vorbis 极大的关注。这种音频格式的最大特点在于技术公开,软 / 硬件制造商在相应的许可下可以自由使用 Ogg Vorbis 而不需要缴纳任何版权费。因此, Ogg Vorbis 在 PC 上获得的支持非常多,大量的抓轨软件提供抓取为 Ogg Vorbis 文件的支持;相当多的播放器都支持播放 Ogg Vorbis 文件(不过 Windows Media Player 和 Real One Player 并未内置支持,需要安装一个解码 Ogg Vorbis 的 Directshow 插件);许多专业的音频编辑软件都支持读写 Ogg Vorbis 文件等。目前连英国 BBC 广播公司都使用 Ogg Vorbis 技术播放其在线节目,可以说在 PC 上 Ogg Vorbis 是前途光明的。至于硬件播放器方面,由于 Ogg Vorbis 的整数解码器刚出来不久,各 DSP 厂商推出的支持产品还不多。但支持的厂家包括了像德州仪器( TI )这样的巨头,相信很快就可以在播放器上进行播放。

      可能有朋友会问,那 Real Media (文件类型为 RM 或 RA )呢? RM 的音质也可以啊。但对于 RM ,大家可以发现,能播放 RM 的软件除了 Real One Player 之外就几乎没有。这是由于 RM 的技术授权限制非常多,具有排他性,因此在计算机上的支持一直都不广泛。还有就是要制作 RM 文件,也只能用 Real One Player 。如果要解码或修改 RM ,则也只有 Real Producer/Sound Forge 等少数几个软件。而硬件播放器就更可怜,至今我都还没有看到哪个播放器是提供支持的。所以, RM 就不适宜我们的便携播放了。

      其他的压缩格式还有很多,但由于各种原因就极少获得硬件播放器的支持。大多数都只能停留在软件形式了。不过值得一提的就是无损压缩格式 FLAC 。它目前已经加入到 Ogg 计划中(以后就是 Ogg FLAC )。 FLAC 也是一个开放源码的压缩格式。由于它的文件结构设计的比较好,比 APE 格式( Monkey’s Audio )的容错性要高,因此获得许多音乐发烧友的好评。并且由于其开放源码的特点,已经有硬件生产商提供对 FLAC 的支持。但由于它是无损压缩,对于普通的闪存型便携播放器来说,生成的音频文件就显得太大,所以也不适合便携播放。

      在我看来,音质好坏与便携播放的关系并不是很大。由于街头巷尾公车上等各处的环境都不会安静到哪里去,所以即使音质再好也很难听得出来。所以用于便携播放的音频格式还是应该以压缩比为前提。能在有限的空间里放下最多的歌曲才是王道嘛!在这一点上, mp3 就落后了:起码要 128kbps 。低于 128kbs 都有比较明显的变形。而其他较新的格式比如 Windows Media Audio 或 Ogg Vorbis 都能在 64kbps 的比特率下提供接近 CD 音质的效果。所以我把所有的歌曲都抓了两遍:一个是在 PC 上播放的,使用 256kbps (压缩质量值等于 8 )的 Ogg Vorbis ,另一个用于便携,使用 64kbps 的 WMA 。不过这种处理方法是以存放空间为代价的。为了节省存储空间,也可以只使用音质好的压缩格式和参数设置来抓取音乐并保存,在需要使用便携播放的时候再使用格式转换软件临时转换到播放器上。这种方法可以节省存放的空间,现在的计算机速度比较快,中间的转换过程也不会耗费很多时间。但这种处理方法由于涉及到不同压缩格式之间的转换,有可能会严重地影响音质,所以源格式就要以比较高的音质来保存,以避免转换后出来的是一堆垃圾。像我选择的 256kbps 的 Ogg Vorbis 格式,是公认可以与无损格式叫板的有损压缩配置,就适用于这种情况。类似的选择还可以包括 256kbps 的 WMA 、上限是 320kbps 的 VBR 方式 mp3 甚至用无损的 FLAC 格式等。

      好了,我们来看看有什么工具可以比较方便地进行音频格式转换这个工作。在网上找了一下,提供音频格式转换功能的软件实在不少,稍微比较了一下,发现有一个比较好的国产软件,叫音频转化大师。这个软件是一个共享软件。经过测试,发现这个软件支持多种音频格式之间的相互转换,既能处理 G721/G723/G726/GSM 等比较专业的编码,也能处理时下流行的 mp3/Ogg Vorbis/WMA 等编码。关键的一点是这个软件可以实现无须中间文件的直接格式转换,比如把 mp3 转换成为 WMA 这样。软件的界面很简洁美观,操作也很方便。你只需要选择需要转换的音频文件及转换的目标格式加入到任务列表中,点击立刻转化按钮便可。如果需要自定义转换目标格式的编码参数,可以通过选项菜单下的音质设置功能进行设置,设置内容包括有 mp3 、 Ogg Vorbis 、 WMA 等多种格式,可以参考抓轨篇中 CDEX 的设置进行修改。

    音频转化大师选择格式界面

    音频转化大师主界面

    音频转化大师压缩编码参数选择

      不过这个软件用起来还有一些问题:首先是帮助内容简单,由于音频转换操作涉及不少专业性的概念,应给用户比较详细的解释。其次是用于进行格式转换的核心是一个由另一家公司开发的组件,而这个组件在很多音频软件中都有使用,结果是在我的试用过程中由于卸载了使用到这个组件的其他软件而导致音频转化大师无法启动,不断弹出非法操作对话框,需要用任务管理器将音频转化大师进程杀掉。重装之后才恢复正常。希望作者能改进这一点。

      老牌格式转换软件 Awave Studio 也是一个可用的选择。它也是一个共享软件。这个软件支持的音频格式非常多,除了常见的压缩格式之外还支持许多乐器采样格式或者语音压缩格式。 Awave Studio 除了可以进行音频转换之外还可以对音频进行简单的编辑和效果处理。但 Awave Studio 也有一些缺点: 1 、它支持的那些乐器采样和语音压缩格式对于一般用户来说没有意义,反而增加了软件使用的复杂度; 2 、 Awave Studio 的发行包中没有捆绑一些必要的第三方软件,比如 Ogg Vorbis 的支持等,需要自行添加; 3 、功能很多,但都不是很精,部分功能(比如录音)甚至可以用简陋来形容; 4 、易用性不高:发掘型的功能界面(也就是需要右键菜单和层层嵌套的对话框)不够直观,缺乏必要的进度显示等等。因此,总体感觉不很好用。

    Awave Studio Interface

      还有什么呢?开放源码的软件也有一个,名字叫 Sound eXchange (缩写 SoX )。这个软件的历史比较悠久,可以追溯到当年 AT&T UNIX/386 的年代,但由于主要面向 Unix/Linux 平台,而且是命令行界面的软件所以一直都不很为人所知。但它的功能很丰富,而且都很专业,比如它的采样率转换功能保真度就非常高。随着开放源码的蓬勃发展, SoX 也出现了一些前端,比如 Sound Studio 。 Sound Studio 通过调用 SoX 来实现包括录音 / 播放 / 格式转换等工作。 SoX 支持的音频格式包括 WAV 、 mp3 、 Ogg Vorbis 等。由于 SoX 是一个跨平台的软件,而 Windows Media 格式不能跨平台,所以 SoX 不支持 Windows Media 。可以在网络上找到 SoX 的源代码来自行编译使用(对于大多数用户来说是 Mission Impossible )或者直接使用已编译的运行文件。但许多已编译的 SoX 都没有将基于 Lame 的 mp3 支持和 Ogg Vorbis 支持编译进去(特别是已经编译的 Windows 版本 SoX ),这也使得其可用性大打折扣。

    SOund eXchange Command Line Interface

    Sound Studio for Linux Interface

    Sound Studio for Linux Interface with Controls

      如果觉得以上方法各有难处(有的要付费,有的不好用等等),你还可以选择通过一些音频编辑软件来进行转换,像后面将会介绍的 WaveCN 就是一个可用的选择。但由于音频编辑软件面向的是编辑而不是单纯的转换操作,因此操作起来相对会繁琐(不断地进行打开 / 另存为 / 关闭操作)而且速度会慢一些。

     

    文件大小与音质的关系以及如何调整
    压缩音频文件的大小主要取决于进行压缩时使用的比特率 (bps ,每秒钟需要多少个二进制位的数量 ) 。对于一种压缩算法而言,通常比特率越高,压缩得到的音频文件体积就越大,但回放时的音质就较好。但是,有一些误区是要澄清的:
    1 、把已经压缩了的音频文件以比原来要高的比特率重新编码并不会得到更好的音质(比如把 128kbps 的 mp3 转换为 256kbps 的 mp3 )。道理很简单:有损压缩会把信息去除,失去了的东西就永远失去了。
    2 、通过质量较差的有损压缩方式得到的音频文件如果转换为使用高质量有损压缩方式的音频格式(比如把 64kbps 的 mp3 转换为 128kbps 的 Ogg Vorbis )可能会得到更差的音质。由于不同的有损压缩格式使用的压缩方法互不相同,它们对音频组成部分的取舍也不同,造成压缩格式的互相转换会丢失质量。因此不建议大家对一个文件进行两次以上的格式转换。
    3 、压缩音频时所使用的比特率与音频文件本身的采样率没有直接关系,压缩质量是两者相辅相成的结果。

     

    新压缩格式 / 多声道格式( mp3 Surround 等)介绍

      虽然市场上已经存在许多种音频压缩格式,但新的技术还是不断涌现。目前新的技术趋势在两方面,一是高采样频率和高量化位数;二是支持多声道。由于高采样频率和高量化位数(例如 192kHz/24bit )对于一般家庭用户意义不大,因此此项技术的发展比较缓慢。而多声道技术则随着家庭影院的不断普及而得到快速发展,相应地支持多声道技术的新音频格式也不断出现。首先出现的是微软的多声道 Windows Media Audio 技术,其次是 mp3 Surround 。目前多声道 WMA 已经可以支持最多 7.1 声道 / 每声道 96kHz · 24bit 的编码。 mp3 Surround 则是 5.1 声道 / 每声道最高 48kHz · 24bit 。但多声道音频并不适合便携播放是影响多声道音频技术发展的重要问题。目前已经有一些公司致力于解决这个问题,提出的解决办法从通过诸如立体声耳机这样的普通立体声播放设备来播放经过运算转换后的多声道音频到发明创造新的环绕声耳机等。但要市场广泛接受这些新技术还需要一些时日。

    欢迎关注微信公众号后私信讨论文章内容!
    本栏目相关
  •  2008-09-30 Rockbox Utility介绍及Rockbox快速安装简介
  •  2005-08-01 如何用WaveCN录制自己的音乐
  •  2008-05-04 Rockbox系列三:关于 Rockbox 的常见疑问
  •  2008-09-28 Rockbox 3.0 释出。
  •  2008-04-08 Rockbox系列一:开源的Rockbox,使你的播放器脱胎换骨
  •  2006-08-26 Windows 播放音频文件音量调节详解
  •  2008-03-17 LA - LosslessAudio 无损音频编码及无损压缩原理介绍
  •  2008-04-21 Rockbox系列二:Rockbox具体有什么功能?
  •  2001-11-20 电脑音效自己做