手机版    二维码   标签云  厨具企业大全

研究人员通过对人类听觉处理进行建模来改进机器人

2024-06-25 10:51 来源: 作者/编辑: 浏览次数:4981 手机访问 使用手机“扫一扫”以下二维码,即可分享本文到“朋友圈”中。

我们很少想到噪音,因为我们正在倾听它们,但是在拥挤的城市广场和繁忙的百货商店等地方隔离音频存在着巨大的复杂性。在我们的听觉途径的较低层次中,我们将个体来源与背景隔离,将它们在空间中定位,并检测它们的运动模式 - 所有这些都在我们计算出它们的背景之前。

受到这种神经生理学的启发,一组研究人员在arxiv.org的预印纸上分享了这一文章(“ 使用仿生双耳声源定位的增强型机器人语音识别 ”),该设计旨在测试地貌(即面部特征)对人脸的影响。声音识别的组成部分,如声源定位(ssl)和自动语音识别(asr)。

正如研究人员指出的那样,躯干,头部和耳廓(耳朵的外部部分)吸收并反射声波,因为它们接近身体,根据声源的位置修改频率。它们前往耳蜗(内耳的螺旋腔)和内部的corti器官,产生神经冲动以响应声音振动。这些冲动通过听觉神经系统传递到耳蜗核,这是一种将信息转发到两个结构的中继站:内侧上橄榄(mso)和侧上橄榄(lso)。(mso被认为有助于定位左侧或右侧的角度以精确定位声音源,而lso使用强度来定位声源。)最后,它们被整合到大脑的下丘(ic)中。

为了在算法上复制结构,研究人员设计了一个机器学习框架,处理嵌入人形机器人头部的麦克风记录的声音--icub和soundman。该框架包括四个部分:一个ssl组件,将音频分解为多组频率,并使用频率波产生模仿corti神经冲动的尖峰; 对某些角度产生的声音敏感的mso模型; 对其他角度敏感的lso模型; 以及一个ic组合的层,它结合了mso和lso的信号。额外的神经网络可以最大限度地减少混响和自我噪声(机器人关节和电机产生的噪音)。

为了测试系统的性能,研究人员使用soundman建立ssl和asr基线以及icub头(配备允许其旋转的马达),以确定头部和内部组件的共振效应。一组13个均匀分布的扬声器采用半圆柱配置,朝向磁头喷射噪声,探测并处理它。

该团队发现,来自ssl的数据可以“显着改善” - 在某些情况下,在句子级别上提高了两倍 - 语音识别的准确性通过指示如何定位机器人头并选择适当的通道作为asr的输入系统。当从头部移除耳廓时,性能甚至更好。

“这种方法与相关的方法形成对比,在这些方法中来自两个通道的信号在用于asr之前是平均的,”该论文的作者写道。“动态ssl实验的结果表明该架构能够处理不同类型的混响。这些结果是我们之前在静态ssl中工作的重要扩展,并支持系统对真实环境中声音动态的稳健性。此外,我们的系统可以轻松地与最近的方法集成,以增强混响环境中的asr [55] - [57],而不会增加计算成本。“

转载:中国机器人网(原始来源:评论:0)

以上是网络信息转载,信息真实性自行斟酌。

 
本文标题:研究人员通过对人类听觉处理进行建模来改进机器人
本文网址:
版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网

文本助手 资讯搜索 分享好友 打印本文 关闭窗口
  • 手机浏览本文

    手机应用中扫描本文二维码,即可浏览本文或分享到您的社交网络中。

  • 微信公众号

    扫描二维码,关注中华厨具网微信公众号,实时了解行业最新动态。

今日热点文章更多
品牌聚焦更多
推荐品牌更多
热门频道
关闭广告
合作伙伴:
中华厨具网 鲁ICP备2021046805号         鲁公网安备 37162502000363号 (c)2018-2026SYSTEM All Rights Reserved 投资有风险 加盟需谨慎
关闭广告
关闭广告