AI音频技术进入广播的影响
人工智能(AI)在专业音频领域已经占据了重要地位。它正在自动化和简化编辑、混音、母带处理等工作,并且越来越多地涉及到音乐创作和生成。这使得制作人和工程师能够更快、更高效地工作,并提供了新的创意可能性。即便如此,人们仍然担心人类创意输入的潜在损失,以及AI生成内容的伦理问题。
下面是就此专业音频发展进程中的转折点一些行业思想领袖的看法。
NBC体育音频工程高级总监
Karl Malone
NBC体育的Karl Malone表示:“AI的美妙之处在于其分析场景和评估音频信号参数的能力,远超我们人类所能做到的。”
我很高兴能看到新的AI工具在广播音频中能实现什么。我们已经依靠Cedars、Isotopes和上混音引擎来处理复杂任务,而在欧洲足球比赛中使用Kick来混音足球效果,就足以让我们认真对待自动化和智能技术了。
AI的美妙之处在于其分析场景和评估音频信号参数的能力,远超我们人类所能做到的。尽管A1(此处可能指音频工程师或类似角色)在脑-手-眼协调方面很出色,但我们根本无法匹敌AI的计算预见性。AI能够实时处理信息,预测结果,并根据其分析和特定情境下的训练,做出决策或提出建议。
然而,定义A1工作的艺术细微差别和创意专业知识是不可替代的,这使得AI无法独自完成大型广播节目的混音工作。话虽如此,AI在处理次要输出方面可能非常有效,比如为第二屏幕馈送创建专用混音——例如,专注于混音近距离的足球效果和电台解说作为单独的音频馈送。
AI还可以在大量节目馈送的质量控制(QC)方面提供帮助,能够检查音频和视频中的各种视觉和音频混音问题:音视频不同步、视频分辨率质量波动中的伪影、音频缺失、削波、元数据时间戳、相位等。它可以提醒主控室/播出控制中心(MCR/BOC)操作员进行更仔细的查看或监听。
最终,我们决定是否要在这些早期阶段使用它,所以没有人被迫实施。
Audio-Technica广播与制作业务发展总监:
Gary Dixon
音频是动态的,而那些值得聆听的瞬间通常是不可预测的:比如赛车中的撞车、第18洞观众的爆发,或者音乐会上某个音符的稍微延长。在专业音频领域,特别是在麦克风方面,AI将被用作一种工具,帮助硬件在不可预测的音频情况下快速适应。硬件在增益结构、动态范围和总体均衡(EQ)方面可能存在局限,而AI可以协助人类应对这些情况。
然而,为了让音频吸引人类听众,最终的监听阶段和最终调整仍然需要由人类来完成。AI是人类更好地应对由有趣的人性所引发的不可预测事件的一种工具。
Lawo市场营销内容负责人:
Christian Scheck
Lawo的Christian Scheck表示:“AI在生成闭路字幕方面已经取得了良好效果,这项任务过去非常耗时。然而,结果仍然需要由人类进行检查。”
从内容创作的角度来看,生成式AI正展现出极其强大的能力。就视频而言,已经可以向生成式AI引擎输入一些信息来获取可用的素材。
同样,在音频方面,由AI引擎创作和演奏的音乐开始让词曲作者和表演者都感到担忧,而视频的人工生成旁白和广播的实时解说则成功欺骗了越来越多的听众,让他们相信自己听到的是人类的声音。
AI在生成闭路字幕方面已经取得了良好效果,这项任务过去非常耗时,而现在可以在几分钟内完成。然而,结果仍然需要由人类进行检查,以确保一致性、语气,尤其是准确性。
在广播行业,更先进的算法可以帮助音频工程师应对迅速增长的工作量,尤其是在沉浸式音频混音场景中,这需要监督和交付多种呈现形式和下混音格式——所有这些都通过一台控制台和一名A1(音频工程师)来完成。
最终,AI在现场制作场景中的成功将取决于它如何应对意外情况。它很有可能成为基于Lawo解决方案的媒体制作的强大助手,但它是否能够取代DSP音频或高质量视频处理,还有待观察。
AI还可以在其他方面创造价值。例如,在现代的基于软件的平台上,如HOME Apps,AI可以简化过程监控,大幅缩短调试时间,减少停机时间,并协助数据分析,帮助预测故障条件。
其他应用可能包括先进的自动混音算法,或在计算资源有限的情况下,智能部署应用程序和服务,以最大限度地提高硬件和软件的利用率。
然而,应用AI时需要加上一层业务治理,因为它也带来了大量挑战。
Q5X首席执行官
Paul Johnson
人工智能将对体育赛事中运动员和官员的音频捕捉规模产生诸多影响。语音转文字技术的速度和质量大幅提升,将促进实时音频处理,从而实现对比赛音频中的粗俗言语和其他不当语言的过滤和修正,以及实时翻译成多种语言。这将使得现场比赛音频内容更加丰富,而这类内容一直深受球迷喜爱。一旦[音频/视频]被转录成文本,存档的音频/视频索引就会变得更容易,存档资料对后期制作来说也将更加有用。人工智能在将适当的音频与宽格式视频源中的自动数字变焦相关联方面也将发挥关键作用。最终,人工智能将能够混合多个音频输入,使声音聚焦于数字变焦的目标并对其进行追踪。
从Q5X的角度来看,人工智能是推动体育赛事现场音频广泛应用的使能技术,并且随着处理能力和速度的提升,其应用将继续增长。我们致力于在比赛期间安全地捕捉来自运动员和官员的高质量音频。这种高质量音频是人工智能发挥其魔力所必需的输入。
舒尔市场开发经理:
Ben Escobedo
尽管人工智能(AI)这一术语常因被视为仅用于生成图像或文本的“有趣玩具”而受到批评,但其未来有望成为音频行业的宝贵合作伙伴。人工智能将助力自动化重复性任务,应对复杂挑战,改进音频工作流程,并为操作人员节省大量时间。像微软Copilot这样的人工智能助手需要一流的音频质量来有效捕捉和处理声音,而舒尔致力于提供这样的音频质量。
人们普遍担心人工智能可能会取代音频行业的职业。然而,人工智能应被视为助手,而非替代品。尽管人工智能不断进步,但人类在理解和有效沟通方面的能力仍然远远优于机器。现场直播和音响制作需要快速、即兴的思维来解决关键问题,这些问题往往决定了一场演出的成败——这是目前人工智能无法复制的。