La próxima batalla para las compañías de algoritmos de voz | ¿Por qué es el chip?

Muchas compañías de algoritmos de IA han atacado en los campos de reconocimiento de voz y procesamiento de imágenes, y han introducido el entusiasmo del capital. Pero ahora el viento ha cambiado. La compañía de algoritmos de IA descubrió que el algoritmo no podía convertirse en un "mango" continuo en el proceso de búsqueda de aterrizaje. Empecé a buscar el camino de la transformación. Este no es el caso. Recientemente, varias startups domésticas de voz han lanzado sucesivamente aterrizajes "duros", y han lanzado chips de voz específicos para AI, como Spirit, Going Out, Rokid, Yunzhisheng, etc. La 'pelea entre ellos' y el entusiasmo mutuo entre ellos, la era del algoritmo de inteligencia artificial solo ha cambiado, la batalla del próximo chip dedicado de voz AI ha comenzado.

El final del algoritmo

Para estas empresas, la elección de "incompatibilidad" puede deberse a la situación.

El Año del espacio co-fundador Yang Yuxin decir verdad, su quinto en la última rueda gira Chong campamento Desarrollo que las empresas de nueva creación puros que se pueden hacer a largo plazo algoritmo es difícil, porque hay un algoritmo de cuello de botella y el techo, simplemente no puede vender Gran cantidad de dinero, así que asegúrese de combinarlo con el hardware para lograr un valor comercial.

El valor comercial está estrechamente relacionado con la aplicación de la escena. En un escenario de segmentación determinado, el valor comercial radica en la capacidad de lograr las funciones correspondientes con el mejor hardware rentable y de relación rendimiento / potencia. Estos escenarios no están disponibles cuando la cantidad es grande. Es imposible intervenir, porque las grandes empresas valoran el mercado de decenas de millones de envíos. "Yang Yuxin cree que" en este período de 'vacío', la empresa que hace el algoritmo debe estar integrada verticalmente, es decir, usar el chip para garantizar Sus propios valores y beneficios principales. Dado que tiene capacidades de IA, basadas en sus propios algoritmos y capacidades para desarrollar el chip que mejor se adapte a usted, para lograr la mejor combinación, esta es la tendencia inevitable de la maximización del valor comercial de la compañía de algoritmos de IA.

Obviamente, este es el resultado de una 'evolución'. El mundo de los algoritmos debe basarse en el poder computacional. El algoritmo no es suficiente para respaldar el crecimiento futuro. La integración vertical de las compañías de algoritmos de IA se convierte en una elección inevitable.

Las fichas especiales se convierten en un nuevo campo de batalla?

Por lo tanto, la compañía de algoritmos de voz AI 'invariablemente' toma la delantera en pruebas de agua. Recientemente, varias startups de tecnología de voz doméstica han lanzado sucesivamente chips específicos de voz AI. Esta es la primera de estas startups de campo de voz AI, que casi siempre apuestan por AI voice. Chip.

Este aspecto es el algoritmo de decisión 'jaula de pájaro', y también empujó el mercado 'en sintonía' un altavoz de gran inteligencia de mercado en aplicaciones de voz, el ujier en el periodo de venta de reventón, Canalys predice que para el año 2018 mundial altavoz inteligente será enviado más de 56 millones de unidades. Además, el mercado del automóvil, hardware hogar inteligente, como muchos en la escena también comenzó a voz de inteligencia, será más impulsado por brote dedicada chip de voz de la IA.

Actualmente en el mercado de los altavoces del programa de chips inteligentes o procesada por tanto de voz como de chip de propósito general, o chip de voz dedicada existente reaccionar. Por ejemplo Lynx asistente utilizando el chip de voz MT8516 de MediaTek, mijo altavoz usando un chip A113 cristal de la mañana, en en esta situación, a las empresas de tecnología nacionales discurso público con su propio acumulados en el reconocimiento de voz, procesamiento del lenguaje natural, la tecnología de diseño de interacción de voz, para hacer una transición de chip AI integrado de voz y soluciones interactivas para ofrecer servicios de voz es más lógico.

Y con un grupo de compañías de voz de AI uniéndose al grupo de batalla, también hará que la estructura del mercado y las tendencias futuras sean difíciles de entender.

Elección de arquitectura de chip?

Desde el punto de vista de la arquitectura de chip, si se trata de la voz en la nube conocida por la liberación de la primera generación de chips campo UniOne IO 'Swift', o ir a pedir a voz lanzado núcleo módulo de chip pidió Mobvoi A1, o Rokid también dio a conocer SoC chip de KAMINO18 son la principal la integración de alta, de baja potencia, de bajo costo, y otras características se pueden personalizar.

Se ha informado de que el sonido en la nube conocida de 'Swift' CPU de chip + UDPS + arquitectura DeepNet, y salir y pedir Rokid ha anunciado su propio chip se basa en la personalización Nationalchip profundidad chip. País Rokid había confirmado KAMINO18 núcleo basado en 40nm GX8010 proceso Fabricación.

Guoxin Ciencia y Tecnología liberados al final de la GX8008 chip de NPU dos principales capacidades de interacción de voz AI y GX8010, construido cadencia última Tensilica HIFI núcleo 4 DSP, una serie de baja potencia, de bajo costo, fuera de línea e integrada. Iba y le pedía, Fabricantes como Rokid han logrado su IC integrando el procesamiento de la señal del conjunto de micrófonos, reducción de ruido, tecnología de despertador, reconocimiento de huella de voz y algunas habilidades de voz.

Mejor anunció hoy la finalización de Spitzer de la Serie D de 500 millones de yuanes financiación, desde Yuen Wo Holdings, principal inversor Minsheng de China Investment Group, Aventurarse, Foxconn, MediaTek con el elenco. Mejor Spitzer dijo, ahora con un gigante de los chips en los chips de IA alcanzado una cooperación, las dos partes establecer una empresa conjunta para la interacción de voz inteligente de los chips de IA se han desarrollado en el curso de la segunda media fluirá hoja. se informa de que este será un chip ASIC, junto con una acústica capacidades de procesamiento de señal y de voz.

La competencia de chips no es solo una simple relación precio / rendimiento. Proporcionar una solución de interacción de voz global es la clave del 'núcleo'. Entre ellos, Yunzhisheng ha propuesto una solución integrada de núcleo de nube, y es necesario crear una solución integral al salir. Solución de voz suave y dura. Spirit afirma ofrecer servicios de soporte más completos, incluida la plataforma DUI, chip de voz, solución vertical, etc., así como soluciones de profundización y capacidades de plataforma, proporcionando servicios inteligentes, y pronto anunciará Business Assistant Enterprise. Negocio de servicios inteligentes.

La lucha del mercado?

Y este es solo el comienzo de la batalla de chips específica de la voz. En el futuro, habrá más compañías de algoritmos e incluso gigantes "conmovedoras". Este campo de batalla se está vertiendo en muchos jugadores, lo que también está destinado a ser una batalla difícil.

El chip de voz dedicada AI estallido de la sostenibilidad, por un lado, para ver si la aplicación a gran escala de estos chips, por otra parte, depende de las capacidades de interacción de voz de estos productos en el final sea favorecido por el mercado.

La microelectrónica, la Universidad de Tsinghua, Wei Shaojun en una entrevista con los medios, dijo, la aplicación AI asesino, por lo que fue uno de los altavoces inteligentes u otros productos, no sólo han convertido en una necesidad, por lo tanto, sólo la voz verdadera interacción hombre-máquina La corriente principal, con el fin de promover el estallido de chips de voz AI.

Y además de la solución integrada, con la profundidad de la escena es la futura integración de la prueba real. Representación Yang Yuxin, AI compañía de chips sólo si, no hay ninguna escena algoritmo y luego se encontrará con problemas de inmediato los ecosistemas, debe ser escena, existen algoritmos, el chip. ahora, con el chip y el algoritmo, la cuestión clave es la profundidad de la escena para crear una excelente experiencia interactiva de voz?

Pensarán Chi, la nube de sonido sabe, Go Ask, aplicaciones de diseño de Rokid como en la escena hay muchos cruz, son campo concentrada de casa inteligente, automoción, robótica, este debe ser el principal campo de batalla del futuro. Por supuesto, también están explorando activamente los nuevos escenarios de negocio, tales como los servicios de inteligencia, médicos y otros frentes futuras arrastrar más y más.

2016 GoodChinaBrand | ICP: 12011751 | China Exports