Google запускает облачный текст в речь | API делает чтение более естественным@goodchinabrand.com

Популярность умных помощников постепенно увеличивала спрос на текст в речь. В последние годы Google внедряет облачные технологии обучения искусственному интеллекту. Недавно он объявил о запуске нового API преобразования текста в речь, который может превращать текст в естественные звуки и поддерживать различные голоса. Требования к приложениям.

Text-to-speech API поддерживает 12 языков и преобразует их в 32 естественных языка. Контент, написанный компьютером, преобразуется в разговорный язык. Этот API также соответствует новой модели произношения WaveNet. , сделайте произношение более естественным и точным, скорость работы в 1000 раз быстрее оригинала, для вычисления 1-го речевого сообщения требуется всего 50 миллисекунд, а разрешение образца произношения также увеличивается с 8 бит до 16 бит. Google сказал, что в английском тесте WaveNet более 20% людей считают, что произношение компьютера лучше, чем произношение в реальном времени.

В разных интернет-вещах или умных помощниках теперь требуются услуги «текст-речь». В собственных сервисах Google, таких как карты, поиск и т. Д., Есть встроенные услуги «текст-речь». Теперь, когда внедряются API-интерфейсы, сторонние интернет-приложения Things, такие как телевидение , автомобили и т. д. могут воспользоваться этой технологией, так что взаимодействие между компьютером и пользователем может быть более естественным и плавным.