正在阅读:Facebook开源VoiceLoop 根据语音文字合成新语音Facebook开源VoiceLoop 根据语音文字合成新语音

2017-09-07 17:13 出处:其他 作者:PConline 责任编辑:wuyiying1

  【PConline资讯】Facebook研究员近日开源了他们在今年七月发表的一篇论文( Voice Synthesis for in-the-Wild Speakers via a Phonological Loop )中的语音合成方法。

Facebook开源VoiceLoop,根据开放场景语音文字合成新语音

  在论文中,他们提出了一种新的文字转语音的神经网络方法,可以将从开放场景下采样到的声音中提取的文字转化为语音。不同于其他的文字转语音系统,这种方法能够处理从公开演讲中提取出来的非约束性的样本,而且网络架构比现存的解决同样问题的架构要简单。它基于新的移位缓冲内存储器区(shifting buffer working memory),这个缓冲区也可以用于评估注意力,计算输出音频,以及自身的更新。

Facebook开源VoiceLoop,根据开放场景语音文字合成新语音

  通过使用与上下文无关( context-free)的查找表对输入语句进行编码,该表的每个条目包含一个字符或音素。同样,能通过一个短向量来表示说话者,这个短向量也适用于新说话者。而且在生成音频之前,优先准备好缓冲区可以使生成的语音具有可变性。

  上图为实验样例中生成的注意力图,X 轴是输出时间(声学样本),Y 轴是输入(文本/音素)。

 

   

相关阅读:

语音助理大战!谷歌领先 苹果、三星、亚马逊紧跟

//pcedu.pconline.com.cn/989/9898080.html

联通再获福利!在网一年加赠1G流量100分钟语音

//pcedu.pconline.com.cn/989/9898100.html

亚马逊推出Kid Skills 儿童可以玩语音控制游戏

//pcedu.pconline.com.cn/989/9898073.html

简单几句轻松下单!沃尔玛携手Google推语音购物

//pcedu.pconline.com.cn/983/9835331.html

 

关注我们

最新资讯离线随时看 聊天吐槽赢奖品