手机版    二维码   标签云  厨具企业大全

张胜:让机器人像手机那样人人能用

2024-06-19 10:24 来源: 作者/编辑: 浏览次数:8355 手机访问 使用手机“扫一扫”以下二维码,即可分享本文到“朋友圈”中。

11月6日下午,第七届中国国际机器人高峰论坛工业机器人主题论坛上,广州灵聚信息科技有限公司ceo张胜以《让机器人像手机那样人人能用》为题为我们分享了关于当前人机交互方面的现状及发展趋势。(以下文字根据现场速记整理,仅供参考)

灵聚洛江是做自然语言交互的。关于好莱坞机器人,灵聚科技在两年前也曾有过探讨。很多电影拍摄有时候必须用到一些实际的道具,而不是完全依靠cg,比如涉及到会出现机器人的拍摄场景中,可以先制作出一款机器人,进行角色扮演,后期再进行角色加工,这是完全可行的。

实际上两年前自然语言的技术还不是特别成熟,现在相对来说已经成熟很多。自然语言技术是人工智能技术当中的微小领域,然而只要跟人打交道的产品最终都离不开自然语言交互技术。因为语言是人类传递、传承知识的重要工具和载体,同样机器人想要能够理解人的意图,掌握人类的知识,进行具体的分析和判断,掌握语言这门技能是绕不开的。

张胜首先为大家介绍了关于人机交互的革命历史。以前所有的人机交互手段没有一家是处于核心地位的,比如最早做按钮的公司,做键盘、鼠标的公司,没有一家公司最后成为了一个行业的核心区位领导者。

实际上到现在为止可能也有人认为nlp就是语音交互,但其实语音交互是有两个不同的阶段的。一个是语音命令阶段,另一个就是现在所处的自然语言交互阶段。

语音技术并不等同于语义技术。语音命令只需要发出一个指令就可以了,但如果你和你的ai说“屋子有点黑”,暗示着应该帮忙开一下灯,这就进入了自然语言交互阶段。

自然语言理解是非常快速的阶段,自然语言交互阶段很快将会过渡到认知计算阶段。这个阶段将会整合包括机器视觉,更加丰富的传感器等多模态交互。在输入越来越多的情况下,就需要机器本身能拥有足够的知识和算法数学模型来进行分析判断。在这样的一个大方向上,聚灵科技现在正在做一些相关的研究。相信自然语言交互阶段是能够摆脱前几个人机交互的尴尬状态的。

语言本身是传承人类知识的重要手段和工具,它与以往的三个阶段都不一样,以往的三个阶段实际上是响应人的自然动作,而自然语言交互阶段是在响应人的意图。

nlp在当前的应用领域来讲遇到的问题概括成两个词,一个就是“刚需”,一个是“通用”的问题。

灵聚一直在坚持做通用的自然语言交互技术,外界对此会有两种评论,一种是骗子,另外一种就是疯子。为什么会有这俩种评论?因为做通用非常难,所以现在很多人都改做了垂直场景。灵聚科技一直在这方面考虑如何去落地真技术。其实现在自然语言交互技术非常麻烦的一点是人说了任何一句话,你能不能知道他的意图是?这是其一。

其二,根据上下文来才到它的意图是什么。在这个方面,需要做很多的处理工作。限于神经网络的局限性,神经网络技术解决不了这个问题,因为语言本身是非连续性的,非连续性的语言没办法被神经网络循环、收敛和计算,所以会很快遇到瓶颈。

比如说现在做qa,微软可以和人聊很长时间吗?张胜先生随后又举例了关于最近很火的索菲亚视频,张胜先生认为那并不是真实的交互,而是通过人工编辑的,视频中的主持人也承认了这一点。

在这样一个现实情况下,虽然现在的技术取得了相当的发展,依然有很多的问题有待解决,刚需应该被列在首位。刚需跟通用本身是有一个矛盾点的,刚需往往是某一个具体的应用需求。

张胜随后又谈到了机器人格斗。机器人格斗在细分领域里面解决了一些需求的问题,而且把它成为了一种刚需。作为自然语言交互问题也要解决刚需的问题。整个市场分析包含有俩方面,一个是商用的服务机器人,另一个就是针对儿童的早教机器人。

如何实现技术的通用化?灵聚科技通过自身近5年的积累和思考,分析并实施了以下四点技术。

第一就是技术本身能不能为用户创造价值,这个用户不单纯指最终用户,而是指方方面面的用户。

另外就是标准化,关于技术本身能不能做出一些标准的接口,和服务的标准化。定制似乎成了现在商用机器人在落地的时候的必须,把定制的东西基于我们标准化的平台,通过提供工具变成工具化,然后让这种定制化变成了用户自主的行为,而不再是作为研发商来进行的行为。可视化就是让工具变得不但让懂代码的人用,连不懂代码的人也可以用。

如何让大家都用得起来?像手机一样成为人人可以上手的应用?买智能手机不会给人附加一本很厚的说明书,上手就可以用,灵聚科技希望机器人也是开箱就用,而不是首先要读一个几百页的说明书。针对开发灵聚科技为客户提供了开发者平台,原代码和丰富的自定义能力,包括输出的json也是可以自定义的,还有qa的自定义。因为整个客服机器人系统基于qa,qa本身的技术突破就能够在商用机器人领域解决很多问题。

同时聚灵科技还提供销售渠道。对于一个产品的开发者而言,不需要考虑太多, nlp是怎么实现的,都不需要考虑,只需要考虑好不好用,能不能满足自己的需求,怎么利用已有的技术和丰富的想象力开发产品,把产品规划到极致。对于普通用户来说,就是通过终端服务平台提供可视化的工具,包括提供通过自然语言的方式来编程工具。

用户的自我调校只会改他自己本身的设备,能够让他随心所欲的用起来,把机器人调校成他自己的玩具,调校成他自己的一个东西。通过qaw平台可以调整更加复杂的工作,从几岁到几十岁的人,包括专业水平人的都可以适用。

对于行业开发者,灵聚科技提供核心技术和利益共享模式,比如客服机器人引擎。灵聚科技甚至给客服机器人系统公司提供引擎,概括来说如何让大家用起来,其实就是提供一个让用户觉得有价值的事情,然后让他能够轻松的用起来,达到自己的目的。尤其是在眼前技术并不成熟的时候,更加要在细节上做足功夫,这是张胜先生所提出的一个理念。现在灵聚的官网上可以下载到安卓app的原代码,灵聚科技已经做好了对智能导航、智能计账包括提醒记事,对接引擎几十种场景的支持。如果有人要开发一个智能导航的场景,代码都已经写好了,而客服只需要写一个ui就可以出来了,这就是灵聚科技提供给客户的便捷,同时这个产品上市了之后终端用户依然可以随时用语音的方式来进行设备的调校,这些功能是已经内置好的。

国内很多知名的公司陆陆续续已经使用或者正在对接灵聚的技术,灵聚科技也想通过这样的方式能够给大家提供更便捷的服务,让大家快速的接入灵聚的接口。灵聚科技的接口是按类来分的,几十种场景是一个接口,对应起来非常快,且接口还在不断标准化和统一化。

通过这样一个已经逐渐完善的管理平台,还可以让机器人进行视频讲解,刻意自行定义到了时间轴讲什么词,机器人在讲话的时候,会自动由灵聚科技的人工大脑配动作,不需要设计者去设计动作,如果动作不满意还可以通过动作按钮来编辑该动作。

再比如说讲ppt,每一页上传ppt文件之后选择哪一页是机器讲还是人自己讲,标题是什么,演讲内容是什么,都是可以进行编辑的。另外机器人在演讲过程中可以随时被打断,被打断之后人插完话可以让机器人继续演讲。

最后张胜向大家介绍了聚灵科技新一代的客服机器人引擎。自然语言交互系统在早期被人叫做机器人问答系统,可见机器人就是一问一答的模式,聚灵科技现在在4个方面做了一些工作,最主要的基于deep learning的数据方面的最大问题就是不够精确,聚灵科技把两个结构放在一起,做了更加精准的拓展,新的技术拓展已经不可见,变得抽象化。另外,上下文不需要手动编辑,是系统自动支持的,这一点也很关键,有很多银行客服机器人系统在使用的时候上下文也是需要手动编入的。

包括多轮交互,一个是半编辑模式,一个是全人工编辑的模式,这是不可能全自动的,还需要编辑。关于多行业通用灵聚科技花了很多精力来研究如何制作一个适用于各行业的客服机器人,如何实现机器人的标准化、可视化、工具化。聚灵科技将会提供用户上传word文件或者excel文件让用户在这些文件当中学习新的知识,应用在对应的公司或者行业,然而完全没有人工是不可能的,现有的技术没有人工干预的学习是根本做不到的。

聚灵科技的客服机器人引擎会通过开发平台为客户提供服务,另外也会为相关的客服机器人公司提供引擎的支持。不同的产品输出的功能是不太一样的,灵聚智能所展现的能力跟微信各有不同,但共同的意愿是希望通过尽可能的给开发者提供最简单的使用和接入的方案,给用户提供最佳的局部体验来提升聚灵科技的产品最终被用户认可的认可度。

转载:中国机器人网(原始来源:评论:0)

以上是网络信息转载,信息真实性自行斟酌。

 
本文标题:张胜:让机器人像手机那样人人能用
本文网址:
版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网

文本助手 资讯搜索 分享好友 打印本文 关闭窗口
  • 手机浏览本文

    手机应用中扫描本文二维码,即可浏览本文或分享到您的社交网络中。

  • 微信公众号

    扫描二维码,关注中华厨具网微信公众号,实时了解行业最新动态。

今日热点文章更多
品牌聚焦更多
推荐品牌更多
热门频道
关闭广告
合作伙伴:
中华厨具网 鲁ICP备2021046805号         鲁公网安备 37162502000363号 (c)2018-2026SYSTEM All Rights Reserved 投资有风险 加盟需谨慎
关闭广告
关闭广告