Die Popularität von intelligenten Assistenten hat die Nachfrage nach Text-zu-Sprache Schritt für Schritt erhöht.In den letzten Jahren hat Google cloud-basierte maschinelle Lerndienste für künstliche Intelligenz eingeführt.Es hat kürzlich die Einführung einer neuen Text-zu-Sprache-API angekündigt, die Text in natürliche Aussprache umwandeln und verschiedene Stimmen unterstützen kann. Anwendungsanforderungen.
Diese Text-zu-Sprache-API unterstützt 12 Sprachen und konvertiert sie in 32 natürliche Sprachen.Der Inhalt des Computers wird in gesprochene Sprache konvertiert.Diese API entspricht auch dem neuen WaveNet-Aussprachemodell. , machen die Aussprache natürlicher und genauer, die Arbeitsgeschwindigkeit ist 1000-mal schneller als das Original, es dauert nur 50 Millisekunden, um die 1-Sekunden-Sprachnachricht zu berechnen, und die Auflösung des Ausspracheprobes wird ebenfalls von 8 auf 16 Bit erhöht. Google sagte, dass im englischen WaveNet-Test mehr als 20% der Menschen glauben, dass die Aussprache von Computern besser ist als die Aussprache in Echtzeit.
Jetzt, nach verschiedenen Dingen oder intelligenten Assistenten, müssen Text-zu-Sprache verwenden, Service, eigene Dienste von Google wie Karten, zu suchen und haben so eingebauten Text-to-Speech-Service und sind ab sofort verfügbar API, Anwendungen von Drittanbietern wie zB TV-Vernetzung , Autos und so können von dieser Technologie profitieren, die Interaktion zwischen dem Computer und dem Benutzer kann mehr natürliche und glatt sein.