智能助手应用普及, 对于文字转语音的要求也逐渐提升. 谷歌近年有推出云端人工智能机器学习服务, 最近就公布推出新的文字转语音API, 可以把文字变成自然的发音, 支持各种语音应用需求.
这个云端文字转语音(Text-to-speech)API 可以支持12种语言并转变成32种自然语言, 把电脑中的书面内容, 变成口语形式读出. 而这个API也配合新的WaveNet发音模型, 令读音变得更加自然而准确, 运算速度比原先快1000倍, 只需要50毫秒就可以运算出1秒钟的语音讯息, 而且读音样本的解析度也由8位元提升到16位元. 谷歌表示在美式英文WaveNet的测试中, 有超过20%的人认为电脑读音比真人读音要好.
现在不同的物联网或者智能助手, 都需要用到文字转语音服务, 谷歌自家的服务例如地图, 搜索等都有内置文字转语音服务, 而现在推出了API之后, 第三方的物联网应用例如电视, 汽车等都可以受惠于这个技术, 令电脑与用户之间的互动可以更加自然流畅.