Meta创造了一种为 AI 生成语音添加水印的方法

然而,存在一些重大障碍。Meta表示,它目前还没有计划将其水印应用于使用其工具生成的AI音频。音频水印尚未被广泛采用,且业界尚未就此达成统一标准。此外,AI生成内容的水印往往容易被篡改,例如通过删除或伪造水印。
快速检测以及定位音频文件中哪些元素是由AI生成的能力,对于使该系统发挥作用至关重要,Elsahar说道。他表示,该团队在检测水印方面实现了90%至100%的准确率,比以往尝试对音频进行水印处理的结果要好得多。
AudioSeal由两个神经网络创建。一个用于生成可以嵌入到音频轨道中的水印信号。这些信号对人耳来说是不可察觉的,但可以使用另一个神经网络快速检测到。目前,如果你想尝试在较长的音频片段中发现AI生成的音频,你必须逐秒梳理整个片段,以查看其中是否包含水印。这是一个缓慢且繁琐的过程,对于拥有数百万分钟语音的社交媒体平台来说并不实用。
AudioSeal的工作方式有所不同:它在整个音频轨道的每个部分都嵌入水印。这使得水印可以被“定位”,这意味着即使音频被裁剪或编辑,它仍然可以被检测到。
芝加哥大学计算机科学教授Ben Zhao表示,这种能力以及近乎完美的检测准确率,使AudioSeal优于他接触过的任何以前的音频水印系统。
但是,在这些音频水印被大规模采用之前,需要克服一些重大缺陷。Meta的研究人员测试了不同的攻击以去除水印,并发现有关水印算法的信息披露越多,其漏洞就越大。该系统还要求人们自愿将水印添加到他们的音频文件中。
这为该工具带来了一些根本性的限制,Zhao说道。“如果攻击者可以访问(水印)检测器,那它就很脆弱,”他说道。这意味着只有Meta能够验证音频内容是否为AI生成。
尽管水印作为技术部门的解决方案很受欢迎,但Leibowicz表示,她仍然不相信水印实际上会进一步增强公众对他们所看到或听到的信息的信任。这在一定程度上是因为水印本身也很容易被滥用。
“我怀疑任何水印都无法抵御恶意剥离和伪造,”她补充道。