语音助手哪个好,这个还真不好说,反正自打Siri问世以来,这玩意儿便如日中天地发展起来。尤其是上个月中文版“小娜”(Cortana)的问世,更是瞬间打动万千宅男的心,琴棋书画、念诗卖萌,总之中国老祖宗那些可以数得出来的优良传统,在它身上都能找到。 当然苹果历来“高大上”、WP也并非一般意义上的普众角色,因此短期内咱们也不能奢望这些家伙可以“下嫁”咱们的安卓平台。其实在咱们的Android世界同样也有很多出色的语音助手软件,至于能不能和Cortana一决高下,就得试试看才知道了。
1.天气预报 天气预报是标准的刚需,毕竟这玩意儿直接决定了晚上回家会不会成为落汤鸡的问题。一般来说“今日天气预报”这样的问话,常常会收到比较完美的答案。但问题是,一个正常人是不会这样问的,真正的天气问句其实应该是: “明天热不热?” “明天用不用带伞?” “北京今天几度?” “我后天去北京用不用带伞?” 测试中四款语音助手均给出了正确答案,不过你还是能够从中看到一些小小的差别。 搜狗语音助手:语音播报天气,并给出图表天气。 灵犀(语点版):给出图表天气,并重点回答了我们的问题(语音),“用不用带伞?”和“热不热?”。 百度语音助手:语音播报天气,没有图表天气。 智能360:给出图表天气,并重点回答问题(语音)。 灵犀(语点版)和智能360在本轮测试中表现最好,除了详细的天气指标外,还用语音直接回答了用户最关心的内容——“热不热”以及“用不用带伞”。其实这一点很重要,回想现实中,当你向另一个人询问天气时,到底是想听到啰哩啰唆的天气指标,还是诸如冷不冷,热不热这样言简意赅的话呢?我想答案不言而喻吧。当然从机器角度来讲,能听懂我们的问话并给出正确答案已属不易,但是听懂与会回答之间还有多少距离,我想上面的测试已经回答得很清楚了! 2.闹钟提醒 闹钟也是一项日常使用率超高的功能,除了起床闹钟外,日常做个定时、或者设个计时器什么的也挺方便。当然我们同样也有一些习惯用语,比如说: “设一个5分钟倒计时” “明天4点半叫我起来” “提醒明天下午开会” 搜狗语音助手:支持建立提醒,但需要用户点击确认。 灵犀(语点版):提醒直接建立,且会用语音复述一遍,以免出错。 百度语音助手:提醒直接建立,不过理解能力上有欠缺,语句3直接给出了个网页搜索,这个……未免太有点儿驴唇不对马嘴吧! 智能360:提醒直接建立,也是在理解能力上有短板,对于没有明确时间的提醒不识别。 现实生活中无明确时间的提醒(即例句3)其实很多,虽然对于机器来讲,这个确实难了点儿,可到底还是有搜狗和灵犀(语点版)弄明白了俺的意思。当然那个倒计时提醒着实让众位选手蒙了一下,四员全趴,捏个……今天晚上不管饭了,集体先学习学习再说。 3.ATM、厕所 俗话说人有三急,这出门在外最怕的就是找不到厕所,当然KFC、McDonald显然是个不错的选择,地方干净招牌也比较显眼。不过当你内急到一定程度的时候,任何一步方向上的错误都可能导致重大结果。话说我究竟该向哪个方向走呢?还是把这个问题交给“助手”吧! “最近的厕所在哪?” “带我找厕所” 搜狗语音助手:给出当前所在地附近的厕所,并支持线路规划,但无法导航。 灵犀(语点版):直接启动手机地图客户端,且自动按照最近距离排序,支持导航。 百度语音助手:数据源自百度地图,按距离远近给出列表,点击后也会引导至客户端。 智能360:按距离给出列表,不过点开后是网页版地图,没有导航。需要说一句的是,360的列表给出的是电话而不是距离,这显然是开发组没有按照应用分类的结果,难不成360自己的厕所都有联系电话么? “最近的厕所在哪?”这一句貌似好懂点,几乎所有的助手都给出了正确答案,当然效果有好有坏,比如说灵犀(语点版)和百度语音助手就能直接启动地图客户端,为用户提供专业的导航及定位服务。而第二句“带我找厕所”就显得比较难堪,四款选手中仅智能360给出了正确答案。不过话说它的答案也实在不怎么样,一串公厕联系电话就已经让人有些呵呵了,而且网页版地图也的确无法满足更高级别的定位和导航,话说这一点上远不如灵犀百度直接启动客户端实在。 此外与之类似的还有搜索ATM机等,继续试试。 “附近有建行提款机么?” “最近的工行ATM” 搜狗语音助手:仍然是调用网页版地图,图文混排,也支持线路规划。不过第二句竟给出了北京的搜索结果(俺这里可是和北京相距近200公里呀~),这个……太不科学了吧! 灵犀(语点版):调用地图客户端,识别速度和精度也都很棒,四款中最好的一个。 百度语音助手:很意外吧,我也没想到它一句都没听懂。 智能360:这个不多说了,联系电话栏终于有了用武之地,但光秃秃的列表还是觉得少了点儿什么,当然你也可以点击进入地图,但语音助手就是要减少用户的点击,这个……你不知道么? 显然在自然语义的把握上,各家表现各不相同,尤其对于这种偏向于地理位置的搜索,调不调客户端(地图),或者说能否给用户提供完善专业的搜索指引还是具有很强现实意义的。在这一点上,个人比较倾向于灵犀的表现,直接用地图端回答所有问题。 4.找找包子馆 跑了半天肚子早就抗议了吧,OK!还是让助手推荐几家餐馆吧。PS:我爱吃包子,可这附近有好吃的包子铺么? “附近有好吃的包子铺么?” “推荐个包子铺吧” 搜狗语音助手:第一句没听懂,第二句听懂了,但结果实在太少。 灵犀(语点版):有点悲催的,竟然一句没听懂。 百度语音助手:同样也是没有听懂,而且一个比较搞笑的结果是,它竟然给我列出了一组包子铺图片,话说我哪句话让你搜索包子铺照片咧? 智能360:同样是只听懂了一句,而且结果也算丰富,但还是那个问题,列表里没有距离,网页版地图实在太弱,算了……勉强及格吧。 测试结果依旧喜忧参半,在我们看来也许很平常的语句,到了语音助手这里却变成了深涩难懂的“天书”。当然这个确实和用户选择的语句有关,如果换上另一句“推荐个饭店”也许效果会好很多。但这也从一个侧面反映出现行的语言助手对于自然语义的把握还有很大不足,至少连小学生的水平都没达到。 5. 打电话发短信 当然还有一个功能也是不容错过的,这就是发短信打电话功能,其实这个需求量也不低,比方说日常开车或者手里有其他东西不方便接打电话的,这时就需要助手具备全程语音控制能力了。 “给XX打电话”(XX是通讯录中成员) “给1323086xxxx发短信,告诉他货已经到了”(号码为非通讯录中成员) “给10086发短信,查一下余额”
搜狗语音助手:可以直接播出电话,短信需要手工点一下,无论通讯录好友还是外部电话均能直接拨出,就是识别率低了点,需要多说几遍。 灵犀(语点版):支持直接播出电话,且短信也是全程语音,如果中途需要中止,只要说一下“取消”就行了。而且灵犀的识别率也不错,速度也快,这是它的优势, 百度语音助手:和搜狗差不多,识别率不高,我说五遍,竟然还是识别出了另一位好友(虽说名字确实很接近), 智能360:整体表现接近于百度语音助手,同样也是识别率的问题,识别出了两组联系人。而且一个很大的问题是,它只能识别通讯录内的好友,对于陌生号码无法呼出拨号(短信不影响)。 显然对于“助手”二字的理解,各家厂商并不一致,其中灵犀(语点版)的全程语音是让小编感触最深的。整个过程无需动手,只要说一句“发送”或者“取消”即可完成整个流程,的确让体验提升了不少。当然这里需要特别说一下第三句,原本小编的意思是让操作者说出意图后,语音助手自动转换为代码(比如我们这里的10086就是“CXYE”),但结果大家也都看到了,各家表现都很实在,基本上你说什么就原封不动地写出来,完全是一种炫耀自己“高超”识别率的节奏。事实上这样的问题在很多地方都会出现,助手不单单是要明白用户的话语,对于语句背后的含义也要理解清楚。 7. 最不能忘的测试——嘈杂环境可以用么? 最后这个测试我觉得最不应错过,那就是嘈杂环境下的识别能力,毕竟多数情况下我们都不会在噪音较小的办公室中进行,而嘈杂环境到底会对助手造成多大干扰显然是个颇有意思的话题。 问题是,什么程度才算嘈杂呢?小编拿了个取巧的办法,即把电视机打开,一边看着电视里的《中国好声音》一边测试语音助手,当然这里同样少不了一些日常的测试短句。 “查一下明天到北京的动车” “最近有什么热门新闻没有” 增加环境噪音后,各款助手的表现开始分化,其中给人感触最深的就是识别时间明显加长。不过从最终的结果也能看出,识别效率还不错,除了搜狗的第一条测试未能分离外,其余时候语音助手均可较好地区分开人声与背景声(当然这时测试者的声音也是比较大的),而且智能纠错的介入也让出错率进一步下降,基本上都得到了令人满意的答案。当然这一步同样验证了各家在自然语义上的区别,虽然我认为这两条的难度已经很低了。 写在最后 从上面的测试来看,目前的语音助手在整体识别率方面已经表现不错,至少在一般环境下,是可以收到较为满意的答案的。但从另一个角度来说,高识别率并不意味着语音助手就真的能当“助手”,事实上对于自然语义的把握以及短句的智能理解上,各家的表现仍然还有明显差别。即便是整体表现最佳的灵犀(语点版)在这方面也不是百分百令人满意。 相比之下,微软的Cortana就具备良好的机器自学能力,比方说“我要下馆子”这句话,对于其他语音助手来说,能帮你找到周边饭店已经算满分了,可Cortana的回答却是“是不是去老地方?”。两相对比相信大家更能明白小编的意思,什么才是语音助手的终极目标?什么又是一款语音助手真正应该关注的?这其实才是这篇文章的用意所在!
|
正在阅读:各种调戏出真相!4大国产语音助手横评各种调戏出真相!4大国产语音助手横评
2014-09-11 17:57
出处:PConline原创
责任编辑:caoweiye