Del retraso mental a la inteligencia | El reconocimiento óptico y del habla tomó 100 años

No hace mucho tiempo, versión china Bixby Beta abierta, aunque esto no es Bixby De la primera versión, pero significa que el nuevo gigante de voz comenzó a entrar en el mercado chino encontrado en nuestras pruebas, Bixby Tenga una buena tasa de reconocimiento, puede lograr un desbloqueo de voz, conversión de texto de voz, y los usuarios pueden hacer llamadas de voz a los mensajes de texto del teléfono, control de software, acceso a contenido de terceros y otras operaciones. En cierto sentido, el teléfono Han logrado entender la voz humana.

Pasaron 100 años desde el retraso mental hasta el reconocimiento inteligente de voz a voz

Cuando vemos en las películas de ciencia ficción artificial diálogo inteligencia lata con la humanidad, pero también fue muy alta tecnología, de hecho, asistente de voz en silencio ya tiene en nuestras vidas, de manera que cuando se ve ahora no es bueno productos de voz se siente extraño. en la mente de la mayoría de nosotros, el asistente de voz sigue siendo relativamente 'deficiente mental' existe, de hecho, esto también no se puede negar porque la máquina no es sabiduría, no es como la gente piensa, o que no es una suficiente para que sea pensar en el enorme sistema. pero igualmente innegable que el reconocimiento de voz la inteligencia artificial ya tiene una escala bastante grande.

El reconocimiento de voz ha traído una gran comodidad

Para un ejemplo muy común, la mayoría de las redes actuales de televisión por Internet admiten búsqueda por voz, lo que facilita enormemente el uso de la televisión porque el dispositivo de entrada de la batería todavía está controlado remotamente y su eficiencia de entrada no puede coincidir con el teclado, pero el soporte Voz, siempre que la entrada de comandos de voz en la televisión, puede completar la interacción, es muy conveniente. Además, la interacción de reconocimiento de voz para el uso ciego del dispositivo ha traído el evangelio. Su papel no debe subestimarse.

Asistente de voz del teléfono (imagen de la red)

Creo que hay muchos lectores a quienes no les importa el reconocimiento de voz que tengan esas preguntas: Hermano, ¿estás bromeando? Siri Tire dos, hay parlantes inteligentes en casa, el asistente de voz común. Bueno, ¿cómo habla de Xuanhu? Y el precio de los parlantes inteligentes no es caro. ¿Cómo sería la alta tecnología tan barata? No es realmente un proyecto pequeño desarrollar un asistente de voz, y los asistentes de voz a menudo son difíciles de conseguir, al menos cuando dictas tu voz, los proveedores de IME no te cobran, por lo que sin una financiación fuerte es difícil seguir con ella. Ingresos del día.

El reconocimiento de voz también es insípido (imágenes de la red)

Ahora vamos a ver al fabricante de la publicidad asistente de voz, estamos diciendo que nuestra precisión alcanzó un pequeño porcentaje. Por ahora, la tasa de precisión alcanzada 90%Lo anterior es bastante bueno. Aunque tenemos una tasa de precisión tan alta, pero todavía sentimos algunos de los asistentes de voz insípidos, que es la complejidad del lenguaje, la interfaz de terceros tiene una gran relación entre la integridad de la escuela de fiebre actual, Para hablar sobre la realización de la teoría del reconocimiento de voz, así como sobre el status quo y el desarrollo futuro del reconocimiento de voz, imagine cuándo la inteligencia artificial dominará el mundo.

Este artículo pertenece al artículo original, si se reimprime, indique la fuente: desde el retraso intelectual hasta la luz inteligente y el reconocimiento de voz tomó 100 años http://mobile.zol.com.cn/665/6656792.html

Reconocimiento de voz para alcanzar el principio: base de datos

En resumen, el principio de reconocimiento de voz no es difícil de entender, el mismo gran principio de la cara y el reconocimiento de la huella: el dispositivo de destino para recoger una voz, y después se recoge una serie de procesamiento de voz para obtener información característica voz objetivo, y luego dejar que la característica la información guardada en la comparación de datos de búsqueda de similitud de bases de datos, la mayor puntuación es el resultado del reconocimiento se utiliza entonces para completar el dispositivo de reconocimiento de voz mediante el acceso a otros sistemas.

Identifique brevemente el proceso

Si usted está interesado en el reconocimiento de voz no es muy alta, entonces sabe este principio general es suficiente. De hecho, el proceso de reconocimiento de voz es bastante complejo. La razón más directa es que la complejidad de la voz de identificación de huellas dactilares, siempre y cuando la información de huellas dactilares de entrada La base de datos almacenada en la información coincidente para completar la identificación, la base de datos contiene solo algunas informaciones de huellas digitales, pero la voz es completamente diferente.

"Diccionario Kangxi" (citado de la red de antigüedades chinas)

El diccionario Kangxi contiene caracteres chinos 47035Uno, que duró más de treinta años por el erudito entonces conocido compilado a partir de seis años, mientras que los chinos no son personajes simplemente aislados, no es bajar el tono de la lengua, hay puntuacion emocional, hay diferentes interpretaciones de una semántica diferente. Al mismo tiempo, el país puede tener no hablar mandarín, el dialecto que hay muchos, queríamos construir una base de datos completa se puede imaginar la dificultad de la lengua. es la complejidad de la lengua china Bixby Versión en chino más tarde que la versión en inglés de la razón.

El reconocimiento de voz de alta precisión no se puede separar sin una gran base de datos basada en la nube (imágenes de la red)

La base de datos de gran tamaño es difícil de ubicar en el terminal móvil, por lo que casi todos los asistentes de voz móviles necesitan conectarse cuando el desarrollo del reconocimiento de voz no es sin la versión fuera de línea, pero podemos encontrar fácilmente la versión fuera de línea de la precisión. Más bajo que la versión en línea. Además, hemos mencionado que muchos fabricantes de voz han afirmado que la tasa de precisión alcanzada 90%Arriba, esto se puede decir que es muy notable, no es una exageración decir que esta vez cada mejora 1Un porcentaje de la tasa de precisión es un salto cualitativo. Esto no solo para una base de datos bastante completa, para cumplir con dicha tasa de precisión tiene que ser un algoritmo de reconocimiento más eficiente y un sistema de autoaprendizaje.

Por supuesto, estos datos queremos punto de vista dialéctico, se suele decir, un centenar de palabras diferentes que se pueden describir como lengua china y profunda; ofrecer a los fabricantes y probar la exactitud de los datos es difícil tener extensa, por lo que algunos usuarios a utilizar el reconocimiento de voz Es normal encontrar que todavía tiene discapacidad mental cuando se trata de funcionalidad.

Este artículo pertenece al artículo original, debe volver a imprimir, por favor indique la fuente: de discapacidad intelectual de reconocimiento de voz de inteligentes ópticos pasado 100 años http://mobile.zol.com.cn/665/6656792.html

http://mobile.zol.com.cn/665/6657840.html mobile.zol.com.cn cierto Zhongguancun en línea http://mobile.zol.com.cn/665/6656792.html informe 1512 El principio de reconocimiento de voz: Resumen de base de datos, el principio de reconocimiento de voz no es difícil de entender, el mismo principio cara grande y la huella digital de reconocimiento: el dispositivo de destino para recoger una voz, y después se recoge una serie de procesamiento de voz para obtener voz objetivo Característica de la información, y luego hacer que la información de la función y la base de datos almacenados para búsqueda de similitud y comparación, el puntaje más alto es el resultado del reconocimiento.

Reconocimiento de voz para alcanzar el principio: algoritmos y autoaprendizaje

acabamos de mencionar el algoritmo de reconocimiento para la extracción y sistema de auto-aprendizaje, donde puede ser que simplemente se analiza su proceso de trabajo: En primer lugar, el sistema de reconocimiento de voz para orientar el tratamiento previo de voz recogido, este proceso ha sido muy complicado, contienen muestras de señal de voz, anti-aliasing filtro de paso de banda, y eliminar las diferencias individuales en el dispositivo de la pronunciación, el ruido causado por el medio ambiente, etc. después de procesar la extracción de características del habla.

onda de voz digital (imagen de la red)

Sabemos que la esencia del sonido es la vibración, que puede expresarse mediante la forma de onda, la identificación necesita enmarcar la ola, varios cuadros forman un estado, tres estados constituyen un fonema. El conjunto de fonemas comúnmente utilizado en inglés es Carnegie Mellon University. establecido por el 39Fonemas fonemas constituidos chino generalmente directamente con todas las iniciales y finales como fonemas, además, el reconocimiento de voz divide además en tono atonal. Después de pasar a través de las palabras de síntesis del sistema de fonemas o caracteres. Por supuesto, a juego y el procesamiento posterior de contenido después de que también requiere un correspondiente Algoritmo para completar.

Formulario de texto de salida del proceso de identificación

El sistema es auto-aprendizaje se dirige más bases de datos. La conversión de voz en el reconocimiento de voz de texto del sistema tienen dos bases de datos, una base de datos modelo acústico se puede emparejar con la información extraída, la segunda es una coincidencia base de datos de lenguaje de texto ambas bases de datos requiere de grandes cantidades de datos antes de que el análisis del modelo de formación, también conocido como el sistema de autoaprendizaje para extraer el modelo de datos de utilidad consiste en bases de datos; además, en el proceso de reconocimiento, sistema de autoaprendizaje será usuarios resume hábitos e identificar las formas y luego resumir los datos a una base de datos, permitiendo que el sistema de reconocimiento más inteligente para el usuario.

Todavía resumir más todo el proceso de identificación: una voz meta de recoger la porción de toma de habla procesada contiene información crítica de - extraer información clave - la unidad más pequeña de las palabras de reconocimiento, la disposición de análisis sintáctico predeterminado - análisis semántico frase, la clave de contenido Arreglo de oraciones, ajuste la composición del texto, de acuerdo con la información general para enmendar la ligera desviación del contenido.

http://mobile.zol.com.cn/665/6657841.html mobile.zol.com.cn cierto Zhongguancun en línea http://mobile.zol.com.cn/665/6656792.html informe 1278 Reconocimiento de voz El principio: algoritmo de auto-aprendizaje y el reconocimiento que acabamos de mencionar algoritmos de extracción y sistema de auto-aprendizaje, donde puede ser que simplemente se analiza su proceso de trabajo: En primer lugar, el sistema de reconocimiento de voz para apuntar voz pretratamiento recogido, este proceso ha sido muy complejo, que comprende muestras de señal de voz, filtro de paso de banda anti-aliasing, y eliminar las diferencias individuales pronuncian equipo, inducida por el ambiente ...

Presente y futuro de reconocimiento de voz

Radio Rex perro de juguete

AI no puede suceder durante la noche estallado en los últimos dos años, el reconocimiento de voz no es una excepción. A partir del reconocimiento inicial del prototipo de voz, hasta ahora 90%La exactitud de las anteriores, ha habido cerca 100años de historia. Radio Rex La producción de juguetes en el siglo pasado 20La era, este perro de juguete se puede llamar cuando aparece, se considera el creador del reconocimiento de voz. En el verdadero sentido del reconocimiento de voz comenzó en el siglo pasado 50Edad, AT & T Bell Construido en laboratorio Audry Sistema para lograr el reconocimiento de voz digital en inglés de diez.

Y recientemente caliente NPU Red neuronal, tan pronto como 60La edad se ha utilizado para el reconocimiento de voz. El gran vocabulario, el habla continua, tres características no específicas basadas en un Sphinx El sistema nació en 80Fin de año 90Dado que la edad es un buen momento para el desarrollo de reconocimiento de voz, las agencias gubernamentales comenzaron a otorgarle importancia a la tecnología de reconocimiento de voz. Muchas empresas conocidas han comenzado a invertir fuertemente en esta área. Un gran número de instituciones de investigación de alto nivel se han unido al campo Logro significativo.

Dictado de voz IETF

Hoy, el reconocimiento de voz ha hecho un gran avance. 2017Año 8Mes 20Día ,Tasa de error del sistema de reconocimiento de voz de Microsoft desde 5.9%Reducir a 5.1%, Puede alcanzar el nivel de taquígrafos profesionales; líder nacional en el campo del reconocimiento de voz, se alcanza la precisión de dictado de voz ItexamTech 95%, Rendimiento doméstico difícil como Ali, Baidu, Tencent y otras grandes empresas también han hecho su reconocimiento de voz, la posibilidad de una promesa.

IETF Voice Assistant Voice of the Flying Fish System (imagen de la red)

Y el sistema de reconocimiento de voz no sólo es justo para los teléfonos móviles para interactuar mencionó antes, el mando inteligente de altavoces, juguetes, muebles, hogar, coche, judiciales, médicas, educativas, industriales y muchas otras áreas, el sistema de reconocimiento de voz se reproducirán no puede ser ignorada Después de todo, en un momento en que la inteligencia artificial apenas comienza, la voz interactiva es la forma más eficiente de interacción humano-computadora antes de que los dispositivos puedan detectar fácilmente los pensamientos humanos.

Escribir al final

Vea aquí, creo que tenemos una comprensión general del reconocimiento de voz. Vemos en los teléfonos móviles, el reconocimiento de voz de los hablantes inteligentes, el reconocimiento de voz es solo el campo del iceberg, y veremos que en el futuro habrá Se utilizan más formas de reconocimiento de voz en todos los aspectos de la vida cotidiana, como los sistemas de reconocimiento de voz con automóviles sin conductor. Cuando le dices a un automóvil adónde ir, el automóvil puede llevarte automáticamente a tu destino.

Cuando la inteligencia artificial gobernará el mundo, este problema no dice. AI ha dominado las habilidades de lenguaje natural, incluso con respecto a la capacidad del lenguaje humano es todavía primaria, pero se le ha dado el contenido adecuado en función del programa, que tiene la propia condiciones del juicio, en un sentido, la inteligencia humana es un fundamento clave de la integración funcional viene. pero está claro que esto no es nuestro problema de qué preocuparse, esperar y disfrutar de la comodidad de la inteligencia artificial llevar suficiente.

http://mobile.zol.com.cn/665/6657842.html mobile.zol.com.cn cierto Zhongguancun en línea http://mobile.zol.com.cn/665/6656792.html informe 1851 El reconocimiento de voz status quo y futuro de perro de juguete de radio Rex (Foto citado de la red) de inteligencia artificial no puede suceder brote durante la noche en los últimos dos años, el reconocimiento de voz no es una excepción. Desde el prototipo inicial de reconocimiento de voz, y ahora la tasa de precisión más del 90% Hace unos 100 años, Radio Rex Toy Dog se produjo en la década de 1920, cuando el perro de juguete se llamaba ...