正在阅读:王海峰超复杂需求“严考”百度地图语音助手 AI加持下顺利通关王海峰超复杂需求“严考”百度地图语音助手 AI加持下顺利通关

2018-07-04 17:22 出处:其他 作者:佚名 责任编辑:maoyuanwen

  7月4日,百度AI开发者大会上,百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰用一段绕口令般的复杂需求,对百度地图的语音助手进行了现场“小考”。众望之下,百度地图完美演绎听清、听懂、服务。

 

  “小度小度”

  “我在~”

  “我要从三里屯的团结湖地铁站出发路过望京的家乐福然后再去南锣鼓巷最后到我家,我要红绿灯少的不堵车的最快的路线,你帮我路线规划一下吧。”

  “提供一种导航方式,需要导航吗?”

 

  现场的演示中,百度地图语音助手精准识别、理解了长达60多字的服务请求,并用自然流畅的交互方式提供了导航服务。

  这波操作,让观众感到惊艳。实际上,今年5月,百度地图还并没能如此精准应对这样复杂的需求。

  现场在正式发起挑战前,王海峰播放了一段2个月前网友“调戏”百度地图的视频。视频中,网友对着百度地图语音助手说出了上述超长语音需求,但语音助手并未反馈导航信息,只是机智地“反调戏”称“你有本事再说一遍我就帮你导航”。

  不到2个月,百度地图就获得了快速进步,实现了对复杂需求的精准理解。

  快速进步的百度地图背后,“除了地图本身的技术,还有百度大脑的语音和自然语言处理技术在支持。”王海峰介绍道。

  当百度地图APP收到一条语音请求之后,首先会进行语音的识别,将其转化成文本,然后对该文本进行深度语义理解,并且结合其所在的场景和上下文信息,理解用户的明确意图,从而进行满足,在语音合成技术的加持下,百度地图还会进行AI语音播报输出。

  这也是今年百度AI开发者大会上,全新升级的百度大脑3.0核心能力“多模态深度语义理解”应用场景之一。“多模态深度语义理解”,是指AI对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。简单来说,“多模态深度语义理解”不仅让机器听清、看清,更要深入理解其背后的含义,从而更好地支撑各种应用。

  在百度大脑的加持下, “绕口令”式问路对百度地图来说只是“小菜一碟”。上下班路上的导航互动中,小伙伴们还能与百度地图来段freestyle!与其天天在路上堵得发慌,不如尝试一下百度地图的语音助手功能吧!

关注我们

最新资讯离线随时看 聊天吐槽赢奖品