手机版    二维码   标签云  厨具企业大全

waic 开发者日daniel povey:在中国,打造新一代的「kaldi」

2024-05-16 06:36 来源: 作者/编辑: 浏览次数:946 手机访问 使用手机“扫一扫”以下二维码,即可分享本文到“朋友圈”中。

daniel povey 来到中国半年多了,微博中最常出现的地点是小米科技园。在签下 offer 之前,他曾表示计划在中国打造新一代的「kaldi」。

daniel povey 这个名字为人们所熟知,前前后后大概因为三件事。

一是语音识别开源工具 kaldi 之父的身份;

二是对约翰霍普金斯大学内的学生抗议提出抗议,之后干脆离开学界并怒辞 facebook;

三是漂洋过海来到中国,加入小米,同时被记住的还有他那双一年四季都在穿的凉拖鞋。

语音识别领域的天才

daniel povey 是语音界赫赫有名的人物,他从 1999 年起陆续发表关于语音识别和处理方面的研究成果,迄今为止被引用次数接近 25000 次。

2003 年,daniel povey 从英国剑桥大学拿到了语音识别方向的博士学位,此后近十年间,他一直在工业界做语音方面的研究,先后加入了 ibm 研究院和微软研究院。

在 ibm 研究院的时候,daniel povey 推出了特征空间的判别训练方法,这一方法已成为当前语音识别领域 sota 系统的标配。

他还设计了「子空间高斯混合模型框架」,这是一种后来被广泛应用的建模技术,原理是通过类似说话者识别中的子空间思想来增强高斯混合模型框架。

但 daniel povey 最著名的研究是「kaldi」。2008 年,daniel povey 进入微软研究院,次年开始主导这款语音识别工具包的搭建工作。kaldi 集成了多种语音识别的模型,包括隐马尔可夫和最新的深度学习神经网络,在语音识别方面有着不可撼动的地位。

2011 年,daniel povey 和他的团队在一篇论文中向大家介绍了 kaldi,并公开了所有代码。而 daniel povey 不仅是 kaldi 的主要开发者,也是该论文的第一作者,后来也被称为「kaldi 之父」。

实际上,kaldi 的工作最初也是在 2009 年约翰霍普金斯大学的一场 workshop 上启动的。后来,daniel povey 从工业界退出,在 2012 年进入约翰霍普金斯大学担任助理教授。

这篇关于 kaldi 的论文引用次数现在已经达到了 3000 多次,在 github 上的项目 star 量也已经超过了 8k。在这九年里,daniel povey 一直是 kaldi 主要开发和维护者。

漂洋过海,加入小米

但由于卷入去年的一场校园抗议事件,daniel povey 的研究生涯发生了意外转折。

2019 年 4 月,约翰霍普金斯大学校内出现了抗议事件,学生们占领了学校的行政大楼。不幸的是,clsp(语音语言处理中心)的机房就处在被占领的楼中。因为缺乏维护,机器和数据都面临着被损坏的风险。为了保护机器和数据,daniel povey 在 5 月 8 日夜晚试图用断线钳绞开封锁大楼的铁链,从学生手中夺回机房,但未能成功。

之后 daniel povey 就离开了约翰霍普金斯大学,又因为 facebook 的「六星期审查事件」直接拒绝了 offer。在一系列事件后,他决定来到中国。

「如果任何人想知道后续的话,我的计划是去一家中国公司任职,并可能在中国高校找一份兼职工作。」

与几家中国公司见过面之后,daniel povey 最终选择了小米。

北京时间 2019 年 11 月 18 日,daniel povey 在 twitter 上宣布,他将很快与小米签订一项工作协议,工作地点位于北京,所以自己也会在 2019 年底或者之前搬去北京。在小米的工作内容是打造新一代的「kaldi」。

随后,小米的几位联合创始人也都在微博确认了这一消息。很快,daniel povey 就以小米集团语音首席科学家的身份出席了 2019 小米开发者大会。

来到中国后,他也拥有了自己的微博账号。工作之余,他也会在微博分享在中国的新生活:

拍下这张照片的理由是:「我感觉自己穿这件衬衫的时候,看起来很像大佬的心腹。」

如果足够关注 daniel povey 的动态,还会发现他几乎每天穿着同一双「凉拖鞋」,即使在冬季下雪的日子也是如此。(当然,也许是买了很多双同款)

打造新一代的「kaldi」

对于熟悉 daniel povey 的人来说,他的确是个有些「古怪」的人,与此同时又不得不承认,他是既有天分又足够勤奋的那种人。

在离开美国的半年里,daniel povey 笔耕不辍。大约在近半年的时间里,他的谷歌学术主页就更新了 7 篇论文。

在最近上传的一篇论文中,他和约翰霍普金斯大学的研究人员共同提出了 pychain。对于 kaldi 自动语音识别(automatic speech recognition, asr)工具包中链式模型的端到端无网格最大交互信息(lattice-free maximum mutual information, lf-mmi)训练,pychain 可以实现完全并行化 pytorch 实现。

此外,打造新一代的「kaldi」也是他来到中国的初心。

在不久之后的 2020 年世界人工智能大会云端峰会开发者日专场,daniel povey 也会亲自分享他在语音识别领域的最新思考。

世界人工智能大会云端峰会开发者日(以下简称为 waic 开发者日)作为 waic 云端峰会主题论坛及特色活动,是 waic 期间唯一面向 ai 开发者的专业活动,旨在打造人工智能领域年度最高规格、最专业、最具影响力的开发者盛会。

waic 开发者日将在 7 月 9 日 - 11 日举办 1 场主论坛、多场分论坛、及高峰对话、黑客松等活动,呈现人工智能技术分享盛宴。期间也将宣布上海白玉兰开源开放研究院成立,发布《人工智能开源开放报告》、waic 人工智能青年技术人才奖。

daniel povey 本次将要分享的主题是 《可差分的有限状态机在语音识别及其他序列问题中的应用(differentiable finite state acceptor (fsa) operations for speech recognition and other sequence problems)》,同时参会分享还有多位重磅嘉宾,包括多位图灵奖得主与明略科技首席科学家、明略科学院院长吴信东,悉尼大学教授、优必选悉尼大学ai中心主任、优必选科技ai首席科学家陶大程,百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜,多伦多大学助理教授、neurips 2018最佳论文通讯作者david duvenaud,julia语言创始人之一、julia computing联合创始人兼首席执行官viral b. shah 等。

更多大会精彩内容将陆续对外公布,欢迎各界朋友持续关注 waic 开发者日活动,共同推动人工智能开发者生态的建设和核心技术的研究与进步。

(转载)

以上是网络信息转载,信息真实性自行斟酌。

 
本文标题:waic 开发者日daniel povey:在中国,打造新一代的「kaldi」
本文网址:
版权/免责声明:
一、本文图片及内容来自网络,不代表本站的观点和立场,如涉及各类版权问题请联系及时删除。
二、凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性。
三、转载本站原创文章请注明来源:中华厨具网

文本助手 资讯搜索 分享好友 打印本文 关闭窗口
  • 手机浏览本文

    手机应用中扫描本文二维码,即可浏览本文或分享到您的社交网络中。

  • 微信公众号

    扫描二维码,关注中华厨具网微信公众号,实时了解行业最新动态。

今日热点文章更多
品牌聚焦更多
推荐品牌更多
热门频道
关闭广告
合作伙伴:
中华厨具网 鲁ICP备2021046805号         鲁公网安备 37162502000363号 (c)2018-2026SYSTEM All Rights Reserved 投资有风险 加盟需谨慎
关闭广告
关闭广告