正在阅读：Google为开发者推改进后的语音转文本服务！Google为开发者推改进后的语音转文本服务！

2018-04-11 11:30 出处：其他作者：PConline 责任编辑：wuyiying1

　　【PConline资讯】几周前，Google刚刚对“云端文本转语音”API实施了大改版。现在，该公司又升级了自家的Speech-to-Text语音识别服务。改进后的STTAPI承诺显著提升了语音识别的性能，在内部所有测试中，单词错误率减少了54%左右。不过在某些领域，实际表现要好得多。基于用例，新版API现允许开发者在四种不同的机器学习模型间进行选择。

　　其中有面向短查询和语音命令的，以及一个理解通话语音和处理视频中音频的。第四个模型属于新增默认，谷歌推荐在所有其它场景中使用。

　　此外，谷歌还带来了一项新的标点符号模型。团队承认，其录音文本长期饱受标点符号不太正常的吐槽。用标点符号来表达自己的观点，算是出了名的困难。

　　谷歌承诺新模型可带来更多可读的转录文本，包括更少的断句、更多的逗号、句号、以及问号。

　　本次更新后，谷歌还允许开发者借助一些基本的元数据标记他们的转录音视频。尽管一时发挥不了直接的益处，但谷歌表示，它将使用来自所有用户的聚合信息，来决定下一步要优先考虑哪些新功能。

　　最后，谷歌还试图对这项服务的收费方式做出小小的改动。此前，音频转录的收费标准为0.006美元/每15秒；视频模型的收费翻倍（0.012美元/每15秒）。

　　不过5月31号之后，使用新模型也需要支付0.006美元/每15秒。

相关阅读:

Google正在推出更加真实的文本到语音服务！

//pcedu.pconline.com.cn/1102/11026069.html

Google计划收购Lytro来进一步完善光场技术！

//pcedu.pconline.com.cn/1098/10989647.html

Google移动端搜索图片现提供更多关键词提示信息