穀歌AI說話更自然? DeepMind的功勞

說到各大科技公司的語音助手, 你最喜歡哪一個? 是Google Assistant, 蘋果Siri, 亞馬遜Alexa, 還是微軟Cortana?

據中科院最近的一項研究顯示, 穀歌的語音助手Google Assistant的智商為47.28, 而 Siri 的分值是 23.94. 拋去智商不談, Google Assistant的口碑向來不錯, 其自然流利的語音對話更是讓人印象深刻, 這一點上更是甩Siri幾條街.

為什麼Google Assistant的聲音更加自然? 這還要得益於DeepMind. DeepMind是一家穀歌旗下的人工智慧公司, 為世人熟知的「阿爾法狗」就出自DeepMind.

DeepMind還有一項名叫WaveNet的技術, 這項技術是一種可以生成更加自然的合成語音的神經網路. WaveNet與傳統的連續TTS不同, 傳統的連續TTS使用單個語音演員預錄製的大量語音, 計算機每秒可以使用16,000個樣本建立單個聲音波形. 但是WaveNet使用大量的語音樣本數據, 並且已經進行超過12個月時間的訓練, 根據真實的語音波形, WaveNet可以對合成語音進行音調修正.

下面可以看看這個例子:

使用WaveNet之前

使用WaveNet之後

不知道你有沒有聽出區別?

非常遺憾的一點是, 目前Google Assistant的語音只支援英語和日語, 如果你手上有台Pixel手機, 將系統語言調成英文, 你就能用英文和它進行對話了. 當然, 現在Google Assistant在iPhone上也是可以安裝使用的. 隨著時間的推移, Google將這項技術應用在其他語言上, 肯定也不是問題.


說到各大科技公司的語音助手, 你最喜歡哪一個? 是Google Assistant, 蘋果Siri, 亞馬遜Alexa, 還是微軟Cortana?

據中科院最近的一項研究顯示, 穀歌的語音助手Google Assistant的智商為47.28, 而 Siri 的分值是 23.94. 拋去智商不談, Google Assistant的口碑向來不錯, 其自然流利的語音對話更是讓人印象深刻, 這一點上更是甩Siri幾條街.

為什麼Google Assistant的聲音更加自然? 這還要得益於DeepMind. DeepMind是一家穀歌旗下的人工智慧公司, 為世人熟知的「阿爾法狗」就出自DeepMind.

DeepMind還有一項名叫WaveNet的技術, 這項技術是一種可以生成更加自然的合成語音的神經網路. WaveNet與傳統的連續TTS不同, 傳統的連續TTS使用單個語音演員預錄製的大量語音, 計算機每秒可以使用16,000個樣本建立單個聲音波形. 但是WaveNet使用大量的語音樣本數據, 並且已經進行超過12個月時間的訓練, 根據真實的語音波形, WaveNet可以對合成語音進行音調修正.

下面可以看看這個例子:

使用WaveNet之前

使用WaveNet之後

不知道你有沒有聽出區別?

非常遺憾的一點是, 目前Google Assistant的語音只支援英語和日語, 如果你手上有台Pixel手機, 將系統語言調成英文, 你就能用英文和它進行對話了. 當然, 現在Google Assistant在iPhone上也是可以安裝使用的. 隨著時間的推移, Google將這項技術應用在其他語言上, 肯定也不是問題.

2016 GoodChinaBrand | ICP: 12011751 | China Exports