音频水印技术
“水印”这一术语与信息隐藏科学高度关联。所谓信息隐藏,可以理解为在一种信息中隐藏附带另外一种信息。因此,音频水印技术是指通过修改音频信号从而在原始信号中嵌入附加信息的技术。大量的相关研究已经产生了相当多的嵌入和提取音频信号中的水印数据的技术。大多数的水印系统是在线性域对数据进行操作的(即PCM水印)。少部分可对已被压缩的数据进行水印嵌入(称为比特流水印)。
水印技术对音频数据的修改其程度是轻微的,一般人的耳朵无法分辨出原始信号和已添加水印的音频信号有什么不同。专门的水印探测器则可以从已添加水印信息的信号中读出被嵌入的信息。
Fraunhofer IIS研发了一种强健的音频水印技术。该技术的特点是可保证被嵌入的信息能保持可被读出,而且即使经过诸如MP3压缩/解压过程抑或模拟传输过程等处理后仍然可读。更多的信息可到Music Trace网站获取,该公司目前拥有该技术的由Fraunhofer IIS颁发的许可并负责维护该技术。
总体构思
水印技术的基础构思可通过下图表达。其关键在于附加的虽然听不到但可通过特殊的水印解析器解析得到的信号。水印数据的嵌入过程是依靠于一个解码过程中必须知晓的关键字而进行。
水印的必要条件
一个设计优良的水印嵌入系统应具备一些对于提高安全性和有效性而言是非常必要的属性。水印应具有:
隐藏性,应不能被听到;
对于统计或分析应是透明的;
可抵抗数字信号处理运算;
防篡改;
与音乐的整体直接相关,而不只是在音乐的开头部分(文件头)或音乐中的某个位置;
可由关键字决定其意义;
上述要求可通过将两种基础技术合并而成。这两种技术分别是“心理声学(Psychoacoustics)”和“展布频谱(Spread Spectrum)”调制。
第一种技术通过对人类听觉系统进行建模分析所获得的人类心理声学特性保证了附加的数据不会被听到。而展布频谱调制可把嵌入的信息分散分布在整个时域平面上,从而提供了高度的强壮性,能抵抗各种各样的信号处理攻击。
应用
数据(水印)的兼容传输
基本上,水印算法在现有的音乐内容发布途径上增加了一种新的数据传输途径。数据(水印)的传输在某种程度上可实现向后兼容,可以认为每一种现有的音乐内容发布途径均可以传送带有水印的音乐。因此,水印技术可在广泛的应用领域获得使用。
数字权限管理(Digital Rights Management,简称DRM)
数字权限管理通常被认为是水印技术的主要应用。水印技术可满足数字权限管理的要求,比如所有权认证,数字媒体访问控制,追踪非法拷贝等等。
元数据 META data(注:即用于表达事物本质的描述性内容)
除了IPMP用途之外基于水印技术有许多可实现的应用。其中一种重要的设想是随同音乐一起传输元数据。元数据可包含诸如作曲人,演唱者,音乐类型等信息。
广播
音频水印技术的另一种应用是在广播领域。包括节目类型辨别、广告搜索、广播覆盖面研究等等。
音频质量
虽然通过一种经过精心设计的方法可以把水印信息对听众隐瞒起来,但是,严格地说,音频信号中的任何额外信息均是对原信号的一种修改,因此潜在被听众感知的可能。而实际上,通过使用Fraunhofer IIS水印技术而导致的音频质量降低的程度是非常低的,比目前流行的各种编码技术比如MPEG-2 AAC所带来的音频信号质量的降低程度还要低。
比特流水印
目前,基于互联网或其他渠道进行的压缩的音乐发布已经越来越普及和流行。但是,控制对已发布内容的使用和再分发目前仍不能实现。基于与比特流关联的水印技术可提供一种有用的机制以追踪非法复制或在多媒体内容中附加版权信息以防止可能的非法分发。
压缩域水印嵌入
比特流水印系统可在已经压缩的音频信号中直接嵌入水印。这种技术可适用于为节省存储空间而把比特流进行预压缩的情况,比如互联网音乐提供商便是一例。
线性域水印解析
虽然嵌入过程在压缩域进行,但水印的解析始终是在线性域(即已经解压的音频数据)进行的。这是因为对比特流的解压必须不会破坏已被嵌入的水印。这使得在PCM(脉冲编码调制,即数字化的音频信号)水印和比特流水印之间达成了兼容性,容许对在压缩域或线性域嵌入的水印数据使用相同的水印解析器。图2是复合的处理过程。
收益
比特流水印的主要应用是把媒体内容个人化。这意味着在发布过程中(比如下载或在线聆听),关于发布过程的信息,比如用户ID,可被嵌入到内容中。由此可实现内容的追踪。该系统的先进性包括:
快速处理(可由服务器进行即时水印嵌入)
可存储预压缩的音频。
个人化的水印嵌入
兼容PCM水印技术
可用性
目前,一种适用于MPEG-2AAC预压缩比特流的水印嵌入系统正在研发和测试中。它依赖于一种特设的AAC音频编码器,可随同比特流同时传送信息,从而使得可联合优化音频编码和水印嵌入过程,换来的是提高音频质量、增强水印解码性能以及提高处理速度。
PCM 水印
相对于比特流水印系统,PCM水印系统在线性音频信号中嵌入水印。其基本构思是在音频信号屏蔽阀值下隐藏一个宽带数据信号。这就可以使得水印信号不会被听到。图3是流程图。
水印的解析
水印解析器,简单地,是一种以软件方式实现的展布频谱接收器,它基于伪随机信号的相关性。水印本身可被视作信息比特序列,其意义由系统的用户决定。这意味着这些比特可表达任何信息,或者说,任何信息都可以经由此“水印通道”进行传输。
不可听
水印的不可听是由我们的屏蔽模型保证的。听觉测试可证明水印的嵌入即使对鉴定用的信号也不会产生可被觉察到的失真。
未经许可,不得转载。
本站微信订阅号:
本页网址二维码: