说到各大科技公司的语音助手, 你最喜欢哪一个? 是Google Assistant, 苹果Siri, 亚马逊Alexa, 还是微软Cortana?
据中科院最近的一项研究显示, 谷歌的语音助手Google Assistant的智商为47.28, 而 Siri 的分值是 23.94. 抛去智商不谈, Google Assistant的口碑向来不错, 其自然流利的语音对话更是让人印象深刻, 这一点上更是甩Siri几条街.
为什么Google Assistant的声音更加自然? 这还要得益于DeepMind. DeepMind是一家谷歌旗下的人工智能公司, 为世人熟知的「阿尔法狗」就出自DeepMind.
DeepMind还有一项名叫WaveNet的技术, 这项技术是一种可以生成更加自然的合成语音的神经网络. WaveNet与传统的连续TTS不同, 传统的连续TTS使用单个语音演员预录制的大量语音, 计算机每秒可以使用16,000个样本创建单个声音波形. 但是WaveNet使用大量的语音样本数据, 并且已经进行超过12个月时间的训练, 根据真实的语音波形, WaveNet可以对合成语音进行音调修正.
下面可以看看这个例子:
使用WaveNet之前
使用WaveNet之后
不知道你有没有听出区别?
非常遗憾的一点是, 目前Google Assistant的语音只支持英语和日语, 如果你手上有台Pixel手机, 将系统语言调成英文, 你就能用英文和它进行对话了. 当然, 现在Google Assistant在iPhone上也是可以安装使用的. 随着时间的推移, Google将这项技术应用在其他语言上, 肯定也不是问题.
说到各大科技公司的语音助手, 你最喜欢哪一个? 是Google Assistant, 苹果Siri, 亚马逊Alexa, 还是微软Cortana?
据中科院最近的一项研究显示, 谷歌的语音助手Google Assistant的智商为47.28, 而 Siri 的分值是 23.94. 抛去智商不谈, Google Assistant的口碑向来不错, 其自然流利的语音对话更是让人印象深刻, 这一点上更是甩Siri几条街.
为什么Google Assistant的声音更加自然? 这还要得益于DeepMind. DeepMind是一家谷歌旗下的人工智能公司, 为世人熟知的「阿尔法狗」就出自DeepMind.
DeepMind还有一项名叫WaveNet的技术, 这项技术是一种可以生成更加自然的合成语音的神经网络. WaveNet与传统的连续TTS不同, 传统的连续TTS使用单个语音演员预录制的大量语音, 计算机每秒可以使用16,000个样本创建单个声音波形. 但是WaveNet使用大量的语音样本数据, 并且已经进行超过12个月时间的训练, 根据真实的语音波形, WaveNet可以对合成语音进行音调修正.
下面可以看看这个例子:
使用WaveNet之前
使用WaveNet之后
不知道你有没有听出区别?
非常遗憾的一点是, 目前Google Assistant的语音只支持英语和日语, 如果你手上有台Pixel手机, 将系统语言调成英文, 你就能用英文和它进行对话了. 当然, 现在Google Assistant在iPhone上也是可以安装使用的. 随着时间的推移, Google将这项技术应用在其他语言上, 肯定也不是问题.