近年、Googleはクラウドベースの人工知能機械学習サービスを導入し、テキストを自然な発音に変換してさまざまな声をサポートできる新しいテキスト音声変換APIを発表しました。アプリケーション要件。
クラウドTTS(テキストを音声に変換)APIは、12個の言語をサポートし、32の自然言語、読んで話さフォームに書かれた内容でコンピュータ。また、新しいWaveNetの発音モデルでも、このAPIになってすることができます、1000倍速い動作速度以前に、わずか50ミリ秒第2のボイスメッセージを計算することができ、試料の発音も16ビットに8元解像度の増加よりも、より自然で正確に発音するように。 Googleは、American English WaveNetのテストでは、20%以上の人々が、コンピュータの発音が実際の人の発音よりも優れていると考えていると述べています。
地図や検索などのGoogle独自のサービスには、すべてテキスト読み上げサービスが組み込まれています。そのAPIが導入された今、テレビなどのサードパーティ製のインターネット・オブ・サービスのアプリケーションが導入されました、自動車などがこの技術の恩恵を受けることができるので、コンピュータとユーザとの間の相互作用はより自然で滑らかになる。