物联网

当前位置:主页 > 物联网 > >

思必驰俞凯:智能物联网时代,对话是自然语言

来源:申博   日期:2018-10-19

人工智能是一个旁观者迷的行业。当技术开发者在谈论人工智能的时候,他们在谈论什么?在 2018 年 AIIA 人工智能开发者大会上,思必驰联合创始人兼首席科学家俞凯从技术开发者的角度跟大家谈了谈人工智能语音交互行业内的那些事。

思必驰是行业内比较成熟的智能语音技术解决方案提供商,致力于提供自然语言人机交互解决方案,应用于智能车载、智能家居和智能机器人领域,并且拥有语音识别、语音合成、语义对话及语义唤醒等技术。俞凯作为思必驰联合创始人,系剑桥大学语音博士、上海交大教授 IEEE 高级会员、国家“青年千人计划”、NSFC 优秀青年科学基金获得者及中国语音产业联盟技术工作组副组长。2012 年俞凯在上海交通大学创建智能语音技术实验室,将人机口语对话系统的全面技术引入回国,在人机口语对话交互的主要核心技术领域进行了广泛研究,多次在美国国防部、美国国家标准局组织的大规模语音识别评测,国际研究机构组织的对话系统挑战赛等国际评测和竞赛中获得冠军。

在俞凯看来,信息设备经历了 PC 端时代,移动互联网时代,现在逐步进入智能硬件物联网时代,而随之变化的还有人与机器的交流方式。“在 2017 年底的时候,全世界移动互联网和智能硬件设备的总数首次与人类总数持平,预计到 2020 年会达到百亿。我们会发现人与机器的沟通手段也发生了非常大的变化,之前做文本交互,智能硬件互联网时代大家都采用更自然的交互方式就是语音和图像,尤其是抽象的信息,语音更为重要。”俞凯说道。

随着人工智能时代的发展,尤其是 AI+ 概念的提出后,人工智能产业链开始发生变化,AI+ 专业分化进程在加速。俞凯认为,专业化分工大体上分为三层:基础的支撑层,包括芯片、传感器驱动、软硬件基础技术,以及大数据分析;系统应用层,即 AI 可落地的领域,包括车载、家居、呼叫中心、医疗、教育等垂直领域系统应用。智能交互层,智能交互层分化当中对于感知、认知、表达,有专门若干家平台型公司发力。“而我们思必驰做的就是智能交互层的事情,负责链接基础层和应用层的中间桥梁。”俞凯强调。

“智能物联网时代,不仅仅要做到语音识别,重要的是对话,对话是自然语言处理当中的新兴任务。”俞凯说道。目前市面上主要有三种对话形式终端产品。第一类是问答式的对话,知识来源在于知识图谱或者说问答库;第二类是闲聊式对话,类似微软小冰。第三类就是任务型对话,类似于信息查询,对话中表现出来有特定信息获取任务才能进行的对话。

我们知道,语音交互方式是处理工作或任务时高效的方式,但不能完全取代键盘,因为自然口语交互具有很大的不确定性,同时这也是语音交互开发者的难题。对此,俞凯介绍说,他们会在具体口语交互语境中加入环境感知模块和对话管理模块。但即便如此,不同对话语境下,固定的模块化内容并不能完全试用。“我们看到一个矛盾,技术提供商的定制效率和 B 端用户定制和产品迭代需求不能迅速被满足。“俞凯说。

基于此,思必驰提出的解决方案是——全链路智能对话开放平台 DUI 。该平台实现全链路开发、定制规模化、高度定制、以对话为核心。“在整个对话核心链路上面,我们所碰到的对话界面,不单单要有语音界面,还有图形界面,将这两者结合在一起,就形成了现在的系统,我们希望和人工智能开发者一起共同开发生态。“俞凯介绍。

据介绍,该平台目前有四个系统,分别为:玲珑系统、天机系统、青囊系统、紫薇系统。玲珑系统,即本地端在手机上或音箱上有一个本地系统,可定制相应唤醒词,包括合成音等等对话,相当于将云端内容在本地播放的人工智能播放器。天机系统,可实现洞察力画像。帮助开发者根据直接用户的统计数据,形成相应的用户画像和自动化推荐。青囊系统是一个调的系统,帮助开发者更好的进行调试。紫微系统承接第三方服务,负责对接的内容,音乐、导航等等。

“我们希望与人工智能开发者一起共同打造一个良性的开发生态系统。“俞凯说道。

会后,俞凯在接受采访时表示:“目前的 NLP(自然语言处理)绝大部分还是要借助人工。”因为数据的不完全性以及杂乱性,需要人工辅助标注有用信息。而人工智能究竟能发展到什么程度,能否超过人类。俞凯表示离得还很远,他觉得人工智能可能经过特定数据训练之后,在某一领域会超过人类,但仍会局限在某一领域中,而不会具备跨领域和跳脱思维的能力。

“大数据只是算力的体现。就好像汽车比人跑得快,只说明在机械动力上,汽车的移动速度超过了人的运动能力,但汽车不能像人一样跳一跳或者旋转胯跨越是一样的道理。“俞凯开玩笑的说。

而对于未来智能设备会有什么样的形式出现在大众面前,俞凯认为,会向便携式和穿戴式发展。他指着我们手中的话筒和摄像机说:“未来,可能采访的形式就不像现在你们拿着这么多设备。采访间里可以安装智能语音识别系统,根据我们每个人讲话不同的波束,识别出我们正在进行的对话,并匹配到每一个人。将设备应用到相应场景中去,也是我们思必驰近期在尝试的内容。”俞凯讲道。

俞凯透露,自从去年开始,思必驰开始重点关注智能芯片和自动定制服务,将于今年年底推出自主研制的 AI 芯片以及针对 B 端的智慧服务解决方案,届时会召开发布会介绍产品。

据了解,思必驰在今年 6 月份已完成 5 亿人民币的D 轮融资,由元禾控股、元禾辰坤、中民投领投。截至目前,思必驰的融资总额超过 8 亿人民币。