Google a lancé ces dernières années des services d'apprentissage par intelligence artificielle basés sur le cloud et a récemment annoncé le lancement d'une nouvelle API de synthèse vocale qui peut transformer le texte en prononciation naturelle et soutenir différentes voix. Conditions d'application
L'API Text-to-speech prend en charge 12 langues et les convertit en 32 langues naturelles.Le contenu écrit de l'ordinateur est converti en langage parlé.Cette API correspond également au nouveau modèle de prononciation WaveNet. , rend la prononciation plus naturelle et plus précise, la vitesse de fonctionnement est 1000 fois plus rapide que l'original, il faut seulement 50 millisecondes pour calculer le message vocal de 1 seconde, et la résolution de l'échantillon de prononciation est également augmentée de 8 bits à 16 bits. Google a dit que dans le test WaveNet en anglais, plus de 20% des gens pensent que la prononciation informatique est meilleure que la prononciation en temps réel.
Différents Internet des Objets ou assistants intelligents nécessitent désormais des services de synthèse vocale: les services propres à Google, tels que les cartes, la recherche, etc., intègrent tous des services de synthèse vocale: les applications IoT tierces telles que la télévision , les voitures, etc. peuvent bénéficier de cette technologie, de sorte que l'interaction entre l'ordinateur et l'utilisateur peut être plus naturelle et plus fluide.