正在阅读:阿里巴巴推出了新一代语音识别模型DFSMN 已开源阿里巴巴推出了新一代语音识别模型DFSMN 已开源

2018-06-11 09:56 出处:其他 作者:PConline 责任编辑:liwen1

  【PConline资讯】消息,阿里巴巴达摩院机器智能技术实验室语音识别团队于即日推出了新一代语音识别模型——DFSMN,与此同时团队已将这一模型开源。

  阿里巴巴达摩院机器智能技术实验室此前在刷新SQuAD成绩、KITTI成绩上有着突出表现,也凭借在AAAI、CVPR的论文发表,在学术频道AI科技评论旗下数据库项目「AI影响因子」中有突出表现。此次开源事件,也是阿里巴巴达摩院机器智能技术实验室首次凭借开发事件获得加分。

  据此前了解,这一模型正是在国际声学会议ICASSP2018上做oral报告的DFSMN(深度前馈序列记忆网络)。DFSMN使用基于BLSTM的统计参数语音合成系统作为基线系统,采用广泛使用的跳跃连接技术,在执行反向传播算法时,梯度可以绕过非线性变换。而官方介绍,对比目前业界使用最为广泛的LSTM模型,训练速度更快、识别准确率更高。采用全新DFSMN模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了3倍,语音识别速度提高了2倍。

  据悉,DFSMN模型不仅被谷歌等国外巨头在论文中重点引用,更基于世界最大的免费语音识别数据库LibriSpeech,将全球语音识别准确率纪录提高至96.04%。

  去年12月,上海地铁与阿里云携手推出了上海地铁语音售票机。而刚刚结束的云栖大会武汉峰会上,装有DFSMN语音识别模型的「AI收银员」在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。这两者都是针对在嘈杂真实环境中的语音识别应用。

  正如阿里巴巴达摩院机器智能技术研究院的语音交互智能实验室首席科学家鄢志杰此前接受采访时所表示的一样,「今天语音交互技术的真实水平,与用户的期待、业界的PR存在明显的鸿沟。」而本次阿里巴巴开源DFSMN,也是希望能让更多的开发者群体在语音识别领域能发光发热。

相关阅读:

阿里巴巴造了一个自动送货机器人 能配送鲜食

//pcedu.pconline.com.cn/1129/11292604.html

阿里巴巴领投以色列数据库公司SQream2640万美元

//pcedu.pconline.com.cn/1128/11287589.html

阿里巴巴市值已重回5000亿美元 位居全球第六

//pcedu.pconline.com.cn/1119/11193245.html

 

关注我们

最新资讯离线随时看 聊天吐槽赢奖品