DTS 推出AI技术支持的 Clear Dialogue,提高电视中对话清晰度
2024年IFA展会上的一大音频技术亮点是DTS公司为电视原始设备制造商(OEMs)推出的新型Clear Dialogue设备内解决方案的发布。DTS是Xperi的子公司,利用其在音频处理和增强技术方面的丰富经验和知识产权组合,从内容制作和分发到家庭应用,成功应用基于AI的音频处理技术,提供了一种能够识别、分离和增强电视音频中语音对话的解决方案,以提升用户体验。
DTS Clear Dialogue 是一种新的处理解决方案,用于提升电视音频中对话的清晰度,为家庭用户提供更具吸引力和个性化的音频体验。其动机是解决消费者普遍且反复抱怨的一个大问题——无法清楚理解屏幕上的对话。消费者在理解屏幕对话时遇到困难有很多原因:设备限制、内容来源的音频不一致、环境噪音或个人听力能力。
Xperi最近对1200名美国成年人进行的调查显示,84%的消费者在观看电视节目和电影时遇到了理解对话的困难。作为回应,超过四分之三(77%)的调查受访者表示他们使用字幕,其中三分之一(30%)表示他们总是或经常开启字幕。
DTS和Xperi的其他子公司对这一问题非常熟悉,他们已经提出了许多在源头上改进的解决方案,许多这些解决方案目前正在内容制作和分发中使用。但是,家庭观影体验的可变性是影响对话清晰度的最大挑战之一。作为一种嵌入式解决方案,DTS Clear Dialogue 在现代电视中用于图像和视频处理的同一硬件上运行,为消费者提供个性化和优化音频体验的能力,显著提高他们对对话的理解。
与作为广播标准或数字分发格式的一部分提供的解决方案不同,直接在终端用户设备上解决问题意味着无论来源如何,都能保持一致的体验。特别是考虑到家庭从越来越多的流媒体服务和聚合服务中接收内容。而且,尽管在消费者调查中,大多数观众认为音质非常重要,但现实是,许多家庭仅依赖于越来越薄的电视显示屏中内置的扬声器。这些显示屏中的电视音响系统已经使用了数字信号处理(DSP)来补偿窄频率范围、缺乏低音和响度管理,以在不增加失真的情况下提供更高的感知音量。
“当观众听不清对话时,会降低他们的电视体验质量,而开启字幕只是权宜之计,并不是解决方案。”Xperi的首席产品与服务官Geir Skaaden说。“迄今为止,尝试通过音频后处理来解决问题的方法并没有解决跨语言、内容和环境的复杂底层问题,也无法考虑每个观众的个体差异。我们的基于AI的设备端音频处理解决方案将允许电视OEM为观众提供定制和个性化音频体验的能力。”
audioXpress参加了Xperi在2024年柏林IFA展会上推广的演示,我们可以确认该解决方案在其核心目标上非常有效——直接从电视声音中提高对话的清晰度,并且独立于音量。该解决方案可以通过一个简化的用户界面实现,该界面既有效又直观,同时保持基本内容的完整性,例如在电影配乐中。此前,多家为电视OEM提供服务的DSP供应商尝试使用标准动态处理技术来实现这一目标。但事实证明,固定的动态处理不足以应对通过集成接收器和连接到电视的不同输入设备传送的大量内容源和格式。
DTS Clear Dialogue 利用AI音频处理创新和机器学习技术来识别、分离和增强对话,使听众能够更好地理解对话。它直接根据基本的用户定义偏好对正在观看的内容进行处理,并根据需要动态调整处理。通过在源头进行音频分离,DTS Clear Dialogue能够在不影响其余内容的情况下提高清晰度。此外,Clear Dialogue对语言包容且与内容类型无关(如电影、电视节目、体育赛事、现场活动等)。
Xperi公司家庭和媒体解决方案产品管理总监Sven Mevissen和产品战略副总裁Samara Winterfeld在IFA展会上推广了令人印象深刻的DTS Clear Dialogue演示。
Xperi调查显示,79%的美国消费者表示DTS Clear Dialogue会增加他们对提供该功能的智能电视的兴趣。主要使用场景包括演员说话不清楚(40%);非对话音频元素过大(38%);观众希望以较低的总体音量观看以避免打扰他人(35%);以及电视观看环境过于嘈杂(34%)。
DTS Clear Dialogue为电视OEM提供的解决方案可以识别并分离音频节目中的几乎任何元素以优化其性能——区分对话、音乐和特效等元素。一旦对话被分离出来,可以在最小影响原始艺术意图的情况下进行处理。它还为用户提供了创建个性化配置文件的控制功能,包括对话和非对话设置,以应对听力障碍、听觉环境和不同条件下的音频偏好。