人工智能耳机让佩戴者只需看一眼,就能聆听人群中一个人的声音
5/30/2024
https://www.chatbro.cn/news/6657d284211112f1fb56ee6d
** 华盛顿大学研究团队开发了一种人工智能系统,可以让佩戴耳机的用户通过简短地看向某个说话的人来“注册”他们,之后系统能够实时取消环境中的其他声音,只放通所选说话者的声音,即使用户在嘈杂的环境中移动或不再面对说话者。**
这种名为“Target Speech Hearing”(TSH)的系统,是由华盛顿大学的研究团队开发的。用户只需佩戴带有麦克风的普通耳机,轻触按钮并向目标说话者方向转动头部几秒钟,系统便能识别并学习目标说话者的声音特征。
在实验中,21名测试者对于系统隔离出的目标声音的清晰度评价高出未经过滤的环境声音的平均水平近一倍。该系统目前只能一次性注册一个说话者,并且在注册过程中不能有其他来自同一方向的响亮声音。如果用户对声音质量不满意,可以重新进行注册以改善清晰度。
研究团队计划将该系统扩展到耳塞和助听器上。该项研究得到了摩尔发明家奖学金、托马斯·J·卡贝尔终身教授奖金和华盛顿大学CoMotion创新差距基金的资助。
要点
- 目前市场上的噪音消除耳机虽然能够自动调整声音水平,但用户对于何时以及听哪个声音缺乏控制。
- TSH系统能够通过视觉注册技术,让用户在嘈杂环境中清晰地听到一个特定的说话者。
- 该系统的机器学习软件能够快速适应并锁定目标说话者的声音,并且随着说话者不断说话,系统的性能会进一步提升。
- 该研究是基于之前的“语义听觉”研究的进一步发展,后者允许用户选择他们想要听到的特定声音类别,并取消环境中的其他声音。
- TSH系统目前的局限性包括只能同时注册一个说话者,以及在注册目标说话者时不能有其他来自同一方向的响亮声音。
- 研究团队正在努力将该技术应用到耳塞和助听器上,以便更多用户能够受益。