人工智能可从嘈杂声中分辨特定声音

房琳琳

2017年11月02日08:20  来源:科技日报
 
原标题:人工智能可从嘈杂声中分辨特定声音

  人工智能(AI)设备已经能处理来自独立个人的请求,但跟我们一样,它们在嘈杂的鸡尾酒会上或几个人同时发言的情况下,也会感到“纠结”。《新科学家》杂志官网近日文章称,美国剑桥三菱电机研究实验室的研究人员开发出的声音识别AI设备,能实时分离多个声源,大大提升了自动语言识别能力。

  这项技术首次在日本东京先进技术综合展览会上公开展示,被团队称为“深度聚类”机器学习,可识别多个声源“声纹”中的独特功能。然后,将每个演讲者声音的不同特征组合在一起,允许它从多个声音中将特定特征的声音选出来,最后重建每个人的话语。智能技术使用了多名人士讲的英语进行了培训和学习,即便说话人是日本人,也能轻松地分辨出来。

  据介绍,传统识别语音的方法,利用两个收音器模拟听众两耳朵的位置,只能达到51%的准确性,形成的“鸡尾酒会效应”困扰了AI研究几十年。

  新智能系统可以将两个人的语音成功分离,而且,重建单人语音的精确度高达90%,新技术可帮助家庭和汽车更好地执行智能任务,一次可分离多达5个人的声音,可用于电梯、空调机组和家用产品的智能操控。

(责编:张歌、熊旭)

推荐阅读

世界首台!我国量子计算机超越早期经典计算机“这是历史上第一台超越早期经典计算机的基于单光子的量子模拟机,为最终实现超越经典计算能力的量子计算这一国际学术界称之为‘量子称霸’的目标奠定了坚实的基础。”潘建伟说。【详细】

从“气象特警”到“随身空调” 航天技术来到你身边航天技术民用化已经不是新鲜事。宝宝使用的尿不湿、方便面里的蔬菜包等,这些产品最初都是由航天技术转化而来,而我国现如今在航天技术转化民用方面,更是已经覆盖汽车、电子通信、医疗仪器等多个民用领域。【详细】