您的位置: 首页> 资讯>

人工智能驱动的噪音过滤耳机让用户能够选择要听的内容

导读降噪耳机是在嘈杂环境中生活和工作的天赐之物。它们会自动识别背景声音并将其消除,以获得急需的平静和安静。然而,典型的降噪技术无法区分...

降噪耳机是在嘈杂环境中生活和工作的天赐之物。它们会自动识别背景声音并将其消除,以获得急需的平静和安静。然而,典型的降噪技术无法区分不需要的背景声音和关键信息,导致耳机用户无法意识到周围的环境。

来自华盛顿大学的 Shyam Gollakota 是使用人工智能工具进行实时音频处理的专家。他的团队创建了一个在嘈杂环境中进行有针对性的语音听力的系统,并开发了基于人工智能的耳机,可以选择性地过滤掉特定声音,同时保留其他声音。作为美国声学协会和加拿大声学协会联席会议的一部分,他于 5 月 16 日展示了自己的作品,该会议于 5 月 13 日至 17 日在加拿大安大略省渥太华市中心的 Shaw 中心举行。

戈拉科塔说:“想象一下,你在一个公园里,欣赏着鸟儿的鸣叫声,但随后你会听到附近一群人不停地大声说话。” “现在想象一下,如果你的耳机能让你专注于鸟儿的声音,而其余的噪音就会消失。这正是我们系统想要实现的目标。”

Gollakota 和他的团队将降噪技术与基于智能手机的神经网络相结合,该网络经过训练可以识别 20 种不同的环境声音类别。这些包括闹钟、哭闹的婴儿、警报器、汽车喇叭和鸟鸣声。当用户选择其中一个或多个类别时,软件会通过耳机实时识别并播放这些声音,同时过滤掉其他所有声音。

然而,让这个系统无缝运行并不是一件容易的事。

“为了实现我们想要的目标,我们首先需要一种高级智能来识别环境中的所有不同声音,”戈拉科塔说。

“然后,我们需要将目标声音与所有干扰噪音分开。如果这还不够难,那么我们提取的任何声音都需要与用户的视觉同步,因为他们不能晚两秒听到某人的声音。这意味着神经网络算法必须在百分之一秒内实时处理声音,这正是我们所实现的。”

该团队采用这种人工智能驱动的方法来关注人类语音。依靠类似的内容感知技术,他们的算法可以识别说话者,并将其声音与环境噪音实时隔离,从而实现更清晰的对话。

Gollakota 很高兴能够站在下一代音频设备的最前沿。

免责声明:本文由用户上传,如有侵权请联系删除!