La popolarità degli assistenti intelligenti ha gradualmente aumentato la richiesta di sintesi vocale Negli ultimi anni, Google ha introdotto servizi di apprendimento artificiale basati su cloud e ha annunciato il lancio di una nuova API text-to-speech che può trasformare il testo in pronuncia naturale e supportare varie voci. Requisiti di applicazione.
L'API di sintesi vocale supporta 12 lingue e le converte in 32 lingue naturali.Il contenuto scritto del computer viene convertito in linguaggio parlato.Questa API corrisponde anche al nuovo modello di pronuncia WaveNet. , rendere la pronuncia più naturale e accurata, la velocità dell'operazione è 1000 volte più veloce dell'originale, bastano solo 50 millisecondi per calcolare il messaggio vocale di 1 secondo e la risoluzione del campione di pronuncia viene anche aumentata da 8 bit a 16 bit. Google ha affermato che nel test WaveNet inglese, oltre il 20% delle persone pensa che la pronuncia del computer sia migliore della pronuncia in tempo reale.
Ora, dopo le cose diverse o assistente intelligente, sarà necessario utilizzare text-to-speech di servizio, propri servizi di Google come mappe, ricerca, e così hanno servizi text-to-speech built-in, ed è ora disponibile API, di terze parti applicazioni di rete come la TV , automobili e così può beneficiare di questa tecnologia, l'interazione tra il computer e l'utente può essere più naturale e liscia.