Establecer Micro Red de Noticias (texto / nueve Wan colmillo), Amazon Eco, elfos Ali Lynx y otros oradores de IA, inteligentes, chip de voz aguas arriba forzado marcó el comienzo de un nuevo patrón. Mayo a julio, China tenía más de cinco Voz Tecnología Venture La compañía lanzó chips de voz AI.
16 de mayo, anunció el primer chip de sonido en la nube conocida serie UniOne AI para el Internet de las cosas y el chip de primera generación Swift; 24 de mayo de Go Ask lanzado su primer núcleo módulo de chip de voz AI pidió Mobvoi A1 ; 2 de julio de Rokid lanzó su aplicación de voz AI específica SoC KAMINO18; mientras que, al mismo tiempo, pensar en Spitzer CEO confirmó que la compañía está construyendo una alta Shixing de chip ASIC AI voz, que se espera a finales de este año chip de voz grabada 'trilogía. la voz AI ha estado viniendo a? el desarrollo de chips de voz ha pasado por tres etapas, el chip de propósito general, el chip ASIC y la IA en las primeras etapas de equipos inteligentes de voz (2014-2015), debido al ciclo de desarrollo de chips de largo (18-24 meses ), alta inversión en I + D, en el caso de las ventas de terminales es difícil apoyar brote a escala de chip, el mercado con un chip común.
el chip de propósito general, el chip significa / chip de Codec manera AP + virutas planas / chips DSP combinados, convertidos de digital a analógico chip de señal Codec, el procesamiento de señal digital DSP, cancelación de eco, supresión de ruido, reducción de ruido del habla / mejora y así sucesivamente, y finalmente añadir soporte para representante computación en la nube de chip MediaTek MT8563 y Chi R16 (chip plana).
ASIC, es la segunda fase del desarrollo de chip de voz, que utiliza la CPU de procesamiento de voz adecuado, interfaces de un conjunto de micrófonos múltiples canales acoplados, la voz sobre el soporte algoritmo de cancelación de eco, supresión de ruido, localización de fuente de sonido, técnicas de mejora del habla, y tanto la potencia de cálculo y de baja potencia consideraciones chip de representante MediaTek MT8516, CX20924 Conexant, A113 Amlogic, RK3036 Rockchip y Beijing Jun X1000. tal chip de acelerador red neuronal no está construido, AI y más ayuda Implementación de la nube.
Algunos analistas han señalado que las características especiales del chip es de reconocimiento de voz, la comprensión semántica, síntesis de voz, ejecución de la tarea se lleva a cabo en la nube, pero la nube hay una interacción de voz 'retraso' problema, la limitación de la demanda de equipos de red Usa espacio y trae crisis de datos y privacidad.
El chip de voz AI, que es la tecnología de voz de tercera generación, resuelve estos problemas: (1) Integrar un módulo de procesador AI dedicado (NPU) para acelerar los algoritmos locales de aprendizaje automático; (2) Los chips AI de voz no solo están integrados CPU, NPU, también integra procesamiento de señales DSP, Wi-Fi / Bluetooth y otros módulos; (3) Puede realizar inteligencia 'lado final', convertir funciones comunes de la nube a la local, operar fuera de línea y resolver problemas de privacidad de datos del usuario. Intellect lanzó el CI1006 en 2016, el GX8010 lanzado por Hangzhou Guoxin a finales de octubre de 2017, que es un típico representante de chip de voz AI.
Lo anterior es el "tres pasos" del desarrollo de chips de voz. Desde el mercado de terminales actual hasta la tasa de adopción de los tres tipos de chips anteriores, el chip de voz dedicado es el líder, con datos que muestran que el 70% de las ventas de 30 millones de altavoces inteligentes en 2017 MTK incluye. Los analistas creen que hay dos razones para el uso de chips dedicados. En primer lugar, los chips de propósito general están desactualizados. La mayoría de ellos se toman prestados del chip plano / OTT AP. Simplemente combinan el codificador digital multimedia con el DSP. El efecto no es muy bueno, el segundo es que el chip AI que es nuevo recién está comenzando, y la ecología aún se está estableciendo.
El vicepresidente de Rokid y jefe de la plataforma básica, Zhou Jun, dijo: "En la actualidad, el chip de propósito general ha sido difícil de satisfacer las necesidades de las escenas inteligentes de altavoces. Nuestros primeros productos también usaron un chip de propósito general. Trabajando al mismo tiempo durante mucho tiempo, con un alto consumo de energía y no es portátil, a veces requiere una velocidad de computación de cuatro núcleos o incluso de ocho núcleos.
En la actualidad, MediaTek, Conexant, Jingchen, Ruixinwei, Junzheng, Torch y otros fabricantes son la fuerza principal de los envíos de chips de voz dedicados, luego, con Guoxin, Rodik, salen a preguntar, Yunzhisheng y más Con el surgimiento de AI Voice, ¿los chips de voz de AI eventualmente reemplazarán los chips de voz dedicados, liderando el mercado de aplicaciones de terminales?
Ling Yun, gerente general de la división de Inteligencia Artificial de Hangzhou Guoxin, dijo a los periodistas en la microred que es difícil determinar si el chip de voz de AI reemplazará por completo el chip de voz dedicado. El objetivo final del chip AI es aplicar el producto. Diferentes rutas y prácticas, encuentre el escenario de aplicación correcto.
El líder de la plataforma de voz inteligente de Zhong Haowei, Lao Yuyuan, también dijo a los reporteros: 'Al comienzo del chip AI, muchas compañías están construyendo sus propias rutas técnicas, basadas en la acumulación previa de soluciones de IA, es difícil juzgar quién ganará eventualmente. El punto clave es que no es el momento de matar, es necesario que la industria trabaje unida para construir este mercado.
El anonimato de los encuestados dijo que con la cantidad del estallido de la terminal de voz inteligente, sonido en la nube conocida, vaya preguntar, Rokid, pensando Spitzer y otra compañía de tecnología de procesamiento de voz, con el país a través de las compañías de chips de núcleo como 'personalización' de así, la adición a la matriz AI el desarrollo de chips de voz / módulo en el pasado, aunque el tiempo detrás de MTK, de AMLogic, el rey es, baterías de antorcha y otros, pero con la ventaja de AI propio chip, destinada a obtener más apoyo de mercado.
Según el reportero de microred, el chip AI desarrollado por Guoxin proporciona procesador digital de señal DSP, procesador de red neuronal NPU y interfaces estándar USB / IIS / IIC / UART. Saliendo, Rokid y otros fabricantes no necesitan diseño de IP. Solo se requiere integración de arquitectura. La mayoría de estas integraciones son procesamiento de señal de matriz de micrófono, reducción de ruido, tecnología de despertador, reconocimiento de voz y algunas habilidades de voz. Aunque Yunzhisheng es una arquitectura uDSP y DeepNet de diseño propio, es funcionalmente superior a las dos anteriores. El chip es básicamente el mismo. En resumen, los tres tipos de chips de voz aún tienen sus propios mercados, y el rendimiento final aún está por verse.
Chip personalizado de escena Diez millones de aplicaciones pueden recuperar costos
En la actualidad, la demanda de escena especial chips de AI son diferentes. 'Escena en aplicaciones de IA, sólo la profundidad de los chips personalizados, con el fin de lograr una mejor las funciones de AI se ha convertido en el consenso de la industria. Sin embargo, el alto costo de los chips personalizados, se coloca Un obstáculo frente a muchos fabricantes.
La industria han señalado, AI cantidad de fichas, por un lado tiene suficiente energía para hacer funcionar una variedad de algoritmos de voz, por otra parte, tenemos que hacer mucho en el adaptador para varios escenarios, manteniendo los costes y el consumo de energía para satisfacer la producción a gran escala Requisitos comerciales: este es un gran desafío en sí mismo.
'Si se trata de su propio chip de I + D AI, utilizando el proceso de 40 nm, entonces el costo puede aumentar en lugar de disminuir. Viruta debe compartir los costos de desarrollo en la escala, sólo la tarifa hoja de flujo de proceso de 40nm de hasta 10 millones de yuanes, prorrateados a un millón de PCS (una el número de unidades de producto), medio por pieza costado tanto como $ 10, sin incluir los más altos costos de investigación y desarrollo. 'fuentes de la industria dicen.
En una entrevista con la antorcha tecnología de núcleo establecer reportero Micro Red entrevistó también expresó la misma opinión, el chip en sí es muy bajo margen bruto de un chip de 55 nm, por ejemplo, probablemente tendrá que invertir millones de dólares, excepto los gastos de investigación y desarrollo, sino también su Dijo que solo aquellas empresas poderosas que pueden obtener financiamiento pueden tener la capacidad de personalizar los chips.
En este sentido, Rokid Zhu Bin, jefe de investigación y plataforma de desarrollo no está de acuerdo: 'dispositivos inteligentes que utilizan un chip común es una exageración, necesidades especiales requieren chips especiales para resolver los puntos de dolor, a medida chip de AI es, precisamente, para reducir los costos, hardware de la inteligencia artificial para calcular la fuerza existe una demanda, de gama baja de propósito general la cantidad de fichas no es suficiente, hay muchos diseño de gama alta de uso general chip de redundancia, lo que resulta en un alto consumo de energía. '
Como el punto de vista de Zhu Bin, Kang Heng, vicepresidente de IoT Business Unit, cree que los chips personalizados están diseñados para ahorrar costos en lugar de aumentar los costos. "Las ganancias de la televisión, el aire acondicionado y otros electrodomésticos son suficientes para cubrir el alto costo de los módulos de voz. Sin embargo, el costo de los pequeños electrodomésticos como ventiladores y luces eléctricas es relativamente limitado y las ventajas de los módulos se ven debilitadas. Los clientes quieren fabricar más productos inteligentes y utilizar productos de gama baja, pero no hay un chip adecuado en el mercado. Dentro del producto del yuan, el chip de propósito general no es rentable. Después de construir su propio chip AI, Yunzhisheng puede abrir la solución de chip de la tecnología AI de voz a los clientes, y tener una mayor iniciativa en cuanto a costos y ciclo de suministro.
Estas dos perspectivas muy diferentes, desde la compañía de chips con un punto de partida firme algoritmo completamente diferente. Según el reportero, aunque a medida chip de AI es la inversión astronómica, pero con el fin de lograr terminal inteligente más cerca de la AI, todavía hay muchos fabricantes comenzaron a fabricar chips personalizados .
2016, Rokid Hangzhou desarrollado conjuntamente países centrales KAMINO18 es representativa de los chips personalizados, Chi pensará la segunda mitad está a punto de chips a medida grabado a cabo. Coincidentemente, en marzo de este año, de acuerdo con reportes de medios extranjeros de la Información, Amazon también está siendo utilizado para apoyar encargo del diseño inteligente chip de la IA del altavoz Echo, cuando la noticia de que Amazon ya tiene un conocimiento especializado 449 empleados chip y habilidades.
el chip personalizado tiene un principio de que debe haber una cantidad suficiente para apoyar la recuperación de costos. Como Rokid, Chi va a pensar, cuánto cuesta Amazon invierte en proceso de personalización de chip, la necesidad de depender de la cantidad de esta costos de venta de terminales para recuperar, el corresponsal actual no existe información detallada. sin embargo, Hangzhou Guoxin Lingyun dice que un chip a un punto de equilibrio, al menos este terminal chip para llegar a la cantidad de decenas de millones, si se trata de una costumbre, por lo menos un millón.
El cofundador de Rokid, Wang Yude, también dijo que el punto más importante del chip personalizado es la cantidad, el punto clave de ganancia del chip, el volumen debería alcanzar más de cinco millones.
"Esta es también la diferencia entre el chip AI de Guoxin y Google, el chip AI NVIDIA", dijo Lingyun, Google, NVIDIA está más en el chip en la nube, el chip en la nube no es sensible al costo y consumo de energía, y el tamaño de un solo chip Puede hacer mucho, pero el lado final es diferente, el lado final debe partir del escenario de la aplicación, de acuerdo con la escena real para personalizar, una vez que las ventas de esta escena son difíciles de soportar el costo de personalización del chip, perderá dinero.
Entonces, ¿qué soluciones efectivas hay a corto plazo? Lingyun enfatizó: "Personalizar un chip desde cero no es sensato, y el ciclo de costos es demasiado largo. Se recomienda que la empresa de chips defina el desarrollo del chip tanto como sea posible para cubrir más. Escenarios de aplicaciones, también se recomienda que los proveedores intermedios a menudo se comuniquen con las empresas de chips aguas arriba, permitiendo a los proveedores de chips tener en cuenta las necesidades de los clientes tanto como sea posible en el diseño frontal, por lo que no hay necesidad de pagar costos adicionales.
En la actualidad, se entiende que los productos basados en Rokid, el chip Yunzhisheng AI y el módulo AI han comenzado a comercializarse, y algunas empresas ya han recibido millones de pedidos, lo que es una buena señal. Rokid Zhou Jun le dijo a Jiji Reportero neto: 'En la actualidad, los chips y soluciones de Rokid han madurado y han sido adoptados por compañías de Internet, como el mercado de educación infantil. Confiamos en que podemos personalizar mejores chips para respaldar el mejor desarrollo de los clientes'.
Como lo hacen los fabricantes de 'núcleo', el tránsito micro inteligente de la plataforma de voz Lao Mao Yuan, director de la firma, dijo: 'cien cajas de batalla la interacción de voz AI convertido en un foco caliente, pero la punta del altavoz inteligente del iceberg, de todas las cosas de Internet es el último Un chip no puede cubrir todos los mercados, como los chips de parlantes AI, no se pueden poner en el automóvil. Nos mantendremos en nuestra ruta, haremos chips de voz especiales para AI y soluciones personalizadas ".
Con todo, el costo de chips personalizados AI es un gran problema, pero muchos de los encuestados todavía están de acuerdo en que la escena personalizada valor de la ficha AI será mayor, la tendencia general. En cuanto a la forma de resolver el problema del costo, tenemos que ver Rokid, sonido en la nube conocida, pensando La compañía de personalización de chips AI representada por Bichi puede alcanzar la balanza de pagos dentro del tiempo predeterminado, estableciendo confianza en la industria.