手机版    二维码   标签云  厨具企业大全

如何构建与机器人对话的语音识别解决方案

2024-06-02 09:44 来源: 作者/编辑: 浏览次数:6910 手机访问 使用手机“扫一扫”以下二维码,即可分享本文到“朋友圈”中。

直到最近,在人类语音的机器翻译领域内的进展还远远没有发展到为主流用户带来实质性好处的地步,与机器对话依然还不太顺畅。目前在低功耗音频技术方面的开发活动具有了改善这种永远是瓶颈的人-机交互关系的潜力,而这种先前曾阻碍了语音识别领域内真正进步的瓶颈将被突破。一条通往人-机互动领域内快速创新的道路正在开启,这将沿着我们与机器互动的方向引领诸多有趣的开发活动,这些机器将能够倾听我们,而且越来越多地听懂我们。

语音也许是人类最自然的交流方式,但是将一台机器引入到该过程则产生了对新的行为协议的需求,特别是在语音沟通过程中没有另一方持续视觉线索的时候更为重要。对于早期的用户,第一次电话通话是极不顺畅的;而且即使在今天,双向无线电台的断续通话方式也要求新用户进行一些调整。在这两种情况下,很快就发展出来一些常用的方法来实现相当自然的沟通方式,主要是因为通话的另一方也是人类。随着移动用户面临新的语音识别界面,他们将面临与使用那些很老的通信手段时所出现的类似挑战。

一个更近期的例子是,触摸屏革命展示出了它们如果能实现高品质同时具有可为用户体验带来附件价值的功能时,新的、陌生的、棘手的界面如何切入到主流应用并且受到欢迎。

因此值得去在一个比传统案例更为广泛的意义上去定义语音控制的“性能”。因而能够在考虑到下一代瓶颈时,设计出更多不会过时的解决方案。

构建一种高性能的语音识别解决方案

过去一直用非常简单的性能指标来评估语音识别解决方案。这些指标通常被换算为单独的“精度”或者“命中率”数值,从根本上来表述正确识别字和词组的概率。在定义“性能”时,需要一种更广泛的和深思熟虑的方式,它能够反映语音界面的长期发展潜力,以便向用户提供像触屏界面一样的舒适性和可用性等级。

翻译质量扮演了一个关键的角色,从根本上讲它是一种人工智能,远不止基本的字词识别。访问所有设备功能也使语音识别成为了触摸屏的一种切实可行的替代方案,有趣的是这也使该技术可用于一个更大范围的设备种类,包括像可穿戴技术这样更小的设备。低响应延迟以及一种自然的、“无协议的”的交互方式,以及即使在有噪音环境中也能很好地运行,也改善了体验。这要求精心的系统设计,以使设备级的信号处理技术能够与基于云计算的智能很好地结合,以将这些性能增强带给用户。

去除按键

语音识别目前最大的人体工程学局限性是需要进行按键或者其它机械性启动,从而限制了它在许多环境中的可用性。这种机械触发是功耗这一制约因素的终极结果。为了保持具有竞争力的电池寿命数值,移动设备中待机功耗的预算都极低,典型的电池电流值为单位数毫安。当功率预算这么低的时候,连续地运行语音识别(或者至少随意的语音识别)是不可行的。

到目前为止,一个按键触发器为这个问题提供了一种粗放的解决方案,它通过在按下按键之前禁用语音识别,使功率消耗平均值降到最低。但是,现今的语音触发功能作为一种特性正在被加载到最新的高端音频中枢(audio hubs)上,因为oem厂商希望语音识别功能能够更灵活、更易于使用。通过显著地降低语音识别的平均功耗数值,甚至降到待机模式预算范围内这样的水平,允许主处理器“休眠”。这种功耗降低(通常为一个数量级)是如此的显著,以至于可以完全消除对按键的需要。

转载:中国机器人网(原始来源:评论:0)

以上是网络信息转载,信息真实性自行斟酌。

 
本文标题:如何构建与机器人对话的语音识别解决方案
本文网址:
版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网

文本助手 资讯搜索 分享好友 打印本文 关闭窗口
  • 手机浏览本文

    手机应用中扫描本文二维码,即可浏览本文或分享到您的社交网络中。

  • 微信公众号

    扫描二维码,关注中华厨具网微信公众号,实时了解行业最新动态。

今日热点文章更多
品牌聚焦更多
推荐品牌更多
热门频道
关闭广告
合作伙伴:
中华厨具网 鲁ICP备2021046805号         鲁公网安备 37162502000363号 (c)2018-2026SYSTEM All Rights Reserved 投资有风险 加盟需谨慎
关闭广告
关闭广告