Será la puerta Shen Qiang: escena impulsada con la innovación suave y duro para crear nueva inteligencia artificial maravillosa

15 de septiembre de 2017, organizado por el conjunto de la micro-red, el teléfono móvil de China Unión, Xiamen Semiconductor Investment Group organizó la "serie de micro-semiconductores conjunto" celebrada en Xiamen Haicang.La cumbre de la industria "núcleo" Con el tema del mismo período organizado por el foro de inteligencia artificial especial, de la empresa de puerta, el código Long Technology, Wei Jing inteligente, Yuet disfrutar de la tendencia de la tecnología y Yuen Ding ejecutivos de negocios de audio, talentos de la industria de inteligencia artificial en torno al tema actual caliente , La tecnología principal y estamos preocupados por las tendencias del mercado, la remodelación de temas candentes, el análisis de las tendencias de cambio, la comprensión de los cambios de la industria.

El siguiente contenido recopilado desde la puerta CTO, el fundador del fundador de capital de riesgo Shen Qiang discurso grabado.

Estamos hablando de inteligencia artificial en la cumbre de semiconductores de hoy, y creo que es una ocasión particularmente buena, porque la mayoría de los empleados de inteligencia artificial provienen de la industria del software, y en la cumbre de semiconductores es una reunión particularmente difícil Discusión de la inteligencia artificial, es el diálogo duro y suave y la cooperación entre la plataforma perfecta, y la inteligencia artificial entre los dos lados de la cooperación innovadora creará un infinito maravilloso!

Decimos que los tres elementos técnicos fundamentales del desarrollo actual de la inteligencia artificial son el algoritmo, la potencia de cálculo y los datos, y desde el punto de vista de la innovación, la principal dirección de la innovación de inteligencia artificial es el algoritmo, la potencia de cálculo y la escena.

Ahora podemos ver que la inteligencia artificial no es sólo un concepto, sino que ha comenzado gradualmente en todos los ámbitos de la vida, incluyendo la electrónica de consumo, la salud, las finanzas, la venta al por menor y muchas otras áreas.La inteligencia artificial penetrar en la industria, se está convirtiendo en una remodelación cada El poder de una industria La fuerza de la industria se caracteriza por una estructura multicapa, incluyendo nuevas infraestructuras de computación incluyendo chips AI, algoritmos de aprendizaje profundo y tecnologías de soporte que se utilizan en la imagen y otros campos. Son las capas técnicas de la inteligencia artificial.

Y la inteligencia empresarial generada por el valor de la experiencia se muestra en la capa de experiencia.La capa de experiencia de AI puede ser la experiencia 2B, puede ser la experiencia 2C, es decir, su aplicación específica, mientras que la tecnología de inteligencia artificial valor de la capa de experiencia, Combinación de software abierto y el hardware.Si la seguridad, los vehículos aéreos no tripulados y el futuro puede tener varios billones de mercado de la conducción automática, vamos a encontrar para lograr estos, la recopilación en tiempo real de grandes cantidades de datos necesidad de apoyar la capa de percepción de hardware, Necesidad de adaptarse a las características de inteligencia artificial que computa la ayuda de la viruta, y los resultados de la computación inteligente necesitan ser alcanzados con el hardware para alcanzar la función. Si los requisitos del chip, los requisitos del sensor, los requisitos funcionales de la experiencia son inteligencia artificial y semiconductores La industria combinada para proporcionar una buena oportunidad.

1 innovación escena

Hablando de escenas de innovación de inteligencia artificial, hay algunas áreas familiares de aplicación, como la seguridad inteligente, la conducción automática, vehículos aéreos no tripulados, altavoces inteligentes, robots, etc. Pero además de estas escenas más grandes, de hecho, si cavamos cuidadosamente El valor comercial de la inteligencia artificial, escenas innovadoras es omnipresente.

Me gustaría hablar de un caso particularmente especial. Hace un tiempo, a menudo viajo por fuera, nadie en casa, hay problemas, es decir, mi familia nadie para cuidar del gato y luego tengo una máquina automática de alimentación de mascotas, Este dispositivo puede ayudarme todos los días de acuerdo a establecer el tiempo y los alimentos para alimentar al gato, sin duda este es un segmento de mercado muy pequeño. Entonces me encontré con este automático de alimentación de mascotas empresa CEO de la compañía, charlar cuando me dijo La inteligencia artificial y la alimentación de mascotas tienen una gran relación. Me pregunto cómo cada día de alimentos de punto fijo y la inteligencia artificial tienen algo que hacer? Dijo que muchos usuarios son el hogar para criar más gatos, diferentes gatos en diferentes etapas de edad, diferentes De la condición física, las necesidades diarias de comer no es lo mismo.Por ejemplo, el usuario para gestionar la salud del gato, para controlar el peso del gato, por lo que cada gato para tener un programa de alimentación personalizada.Esta máquina de alimentación automática ya está equipado con una cámara, el original Es hacer el monitoreo remoto con el host, y ahora usar la cámara para recoger la imagen para hacer la alimentación inteligente. Otros están haciendo reconocimiento de cara, quiero hacer reconocimiento de cara de gato - Quiero saber cuándo ¿Qué tipo de gato es la comida antes de comer, y le daré un servicio personalizado de alimentación basado en la situación actual.

Así, incluso en una escena tan pequeña, cuando combinamos la inteligencia artificial, también podemos crear una pequeña escena en el valor comercial de una escena de este tipo es omnipresente. Hacemos hincapié en la escena impulsada, porque la escena Es la clave para la transformación de la tecnología en el negocio, y luego los algoritmos avanzados, y luego la potencia de computación avanzada, si no puede encontrar la escena de aterrizaje, no podemos convertirlo en valor comercial.

2 algoritmo de innovación

En los últimos años, el rápido desarrollo de la tecnología de inteligencia artificial es impulsado principalmente por la profundidad de aprendizaje, esta parte es el algoritmo y el nivel de software para llevar la fuerza motriz , Mientras que el núcleo del aprendizaje profundo se basa en la profundidad de los métodos de aprendizaje de redes neuronales.

La historia de la red neuronal es muy larga, la primera desde 1943 en la red neural propuesta, en las últimas décadas la evolución de la red neuronal después de la subida y la caída .1989 Yan Lecun inventó la convolución de la red neuronal, se encuentra hoy en plena profundidad Red neuronal, y el profesor Hinton en 2006 presentó formalmente el concepto de red de confianza profunda, y la definición de la profundidad de aprendizaje de este nuevo término, pero la profundidad del brote de la educación es sólo hasta 2012 marcó un importante punto de inflexión, este año Hinton Los profesores utilizarán la red de convolución neural basada en la profundidad del marco de aprendizaje aplicado a ImageNet gran concurso de reconocimiento de imagen, el acceso a un éxito sin precedentes, el aprendizaje en profundidad también ha recibido una atención sin precedentes.

ImageNet juego, que se puede decir que es una competencia olímpica en el campo de la visión por ordenador, es una variedad de arena de la tecnología de inteligencia artificial.A partir de aquí los resultados de cada año el juego se puede ver, 2015 es en realidad un nodo histórico. La tasa correcta del objeto es de alrededor del 95% .En la competencia 2015 ImageNet, el Instituto de Investigación de Microsoft a través de la profundidad de hasta 152 capas de super-red ResNet red neuronal, la primera vez para lograr una mayor precisión que las capacidades de reconocimiento visual humano, La tasa de error es de sólo el 3,5% Esto significa que en algunas circunstancias específicas de la computadora ha sido capaz de reemplazar el trabajo de las personas, y el valor comercial enorme desde el principio para ser activado.

A lo largo de los años, la nueva estructura de la red neuronal ha estado emergiendo, y seguir moviendo una dirección más profunda y más profunda, la competencia ImageNet utilizado en la profundidad de la red neuronal, un corto período de 5 años, el nivel evolucionado de 8 capas a más de 1000 capas Y estos algoritmos y software por encima de la innovación, en el hardware también trae nuevas demandas. Hay una red de computación tan compleja, tanto en el lado del entrenamiento del servidor o en el lado del razonamiento, debe ser poder de cálculo extremadamente poderoso para hacer frente a la profundidad de la red neuronal La complejidad computacional requerida.

Los algoritmos de aprendizaje de profundidad se pueden utilizar para hacer frente a imágenes, sonidos y procesamiento de lenguaje natural, pero el campo más utilizado es la visión por computadora problemas relacionados. La visión de equipo puede ser abstraído en varios tipos de problemas, clasificación de imagen, posicionamiento, detección y segmentación. Decir esta imagen, la clasificación de la respuesta es que esta imagen es un gato o un perro, el posicionamiento debe ser señalado que el gato en la imagen de qué área aparece, y la necesidad de detectar los diferentes objetos, más de un gato, más perros separados y La segmentación de la instancia debe distinguir los límites de píxeles de cada objeto.El algoritmo básico de visión por ordenador es la piedra angular de diversas aplicaciones de inteligencia artificial, aplicaciones de seguridad, aplicaciones de robot Ye Hao, detrás son inseparables del apoyo de la visión por ordenador.

Y la combinación de la visión por ordenador y el aprendizaje profundo, el rápido desarrollo del objeto.Por ejemplo, el algoritmo de detección de reconocimiento de objetos en el PASCAL VOC conjunto de datos en el pasado, con el algoritmo R-CNN puede llegar a 53,3%, y ahora uso más rápido R-CNN puede El rendimiento de la R-CNN 0.5fps actualización a la YOLO 155. La segmentación de instancia de objeto, en el conjunto de datos COCO, la precisión de segmentación de 2015 CVPR FCN 62,2% al actual 74,7%. La aplicación de la extensión de segmentación de imagen es la segmentación del video Ahora el aprendizaje en profundidad también se aplica al campo de segmentación de video para identificar el objeto de cada trama en el video.

Estos son los problemas tradicionales de visión por ordenador, tales como nuestro reconocimiento de cara común, el pago de cara de cepillo, reconocimiento de gestos y otras aplicaciones, la gran mayoría puede clasificarse como los primeros cuatro tipos de problemas, y ahora el nivel de algoritmo de la innovación, también Es la innovación de software parte de esto, vemos una gran cantidad de nuevas tecnologías, para activar los nuevos escenarios de aplicación.Por ejemplo, aquí vemos la imagen, vídeo a la conversión de texto.Al contrario, algunos nuevos algoritmos, han comenzado a hacer texto a la imagen De la conversión, como el dictado del usuario de un pasaje, el sistema para generar la imagen correspondiente.Aquí está una descripción de texto de un avión que vuela en el cielo azul en el interior, la computadora generó automáticamente una imagen de este medio diferente entre la conversión, haciendo No sólo podemos consumir contenido digital de forma inteligente, sino que también podemos crear contenidos digitales de una manera totalmente nueva.

Hay varias orientaciones evolutivas importantes en el futuro, la primera es la evolución del aprendizaje supervisado al aprendizaje semi-supervisado y el aprendizaje sin supervisión. Sabemos que el aprendizaje supervisado depende de los datos etiquetados para la formación y el aprendizaje. El progreso emocionante visto en ImageNet es el resultado del uso de datos etiquetados, y aunque hay mucho progreso en métodos de aprendizaje supervisados ​​basados ​​en datos etiquetados, parece que estamos mirando una amplia gama de segmentos La aplicación de la escena está lejos de ser suficiente.Por qué? La dependencia de un gran número de datos de etiqueta es un costo enorme, y este costo está obstaculizando la innovación.Las grandes empresas con datos masivos en el desarrollo de la inteligencia artificial ocuparán una ventaja natural, La innovación de la ruptura de la escena es la necesidad de confiar en un montón de pequeñas microempresas para lograr, ¿cómo podemos hacer pequeñas micro-empresas pueden participar en el proceso de innovación en la inteligencia artificial No confíe en los datos de la etiqueta de la semi-supervisado y el aprendizaje sin supervisión es la clave El

La segunda dirección importante del aprendizaje en profundidad es reducir la dependencia de la cantidad de datos que se pueden aprender con menos datos de entrenamiento.

Si los algoritmos de inteligencia artificial puede confiar en cantidades masivas de datos, no se basan en datos etiquetados, puede utilizar una amplia gama de datos no etiquetados, puede reducir en gran medida el costo de nuestra adquisición de datos, en esencia, es hacer inteligencia artificial Más la democracia, las grandes empresas y las pequeñas empresas tienen más poder igual de participar en esta competencia. La industria se ha dado cuenta de que no se puede satisfacer con la supervisión de aprendizaje de hoy se ha logrado, la necesidad de seguir explorando cómo romper la dependencia de los datos, Etiquetar los datos para lograr la capacidad de aprendizaje.

El concurso ImageNet se basa en datos etiquetados y este año es el último de su último y la parte superior de la competencia WebVision en el campo de reconocimiento de visión por ordenador surgió.La característica principal de la competencia para ImageNet es que el conjunto de datos es un no tripulado de datos, Este es un punto de inflexión notable.Por desgracia, por la puerta a participar en la inversión del código Long Technology ganó el concurso WebVision de este año en el primer mundo.

La tercera dirección de la innovación en el aprendizaje profundo es evolucionar desde la capacidad cognitiva básica de la identificación básica, orientación, segmentación, etc., hasta el nivel humano, donde podemos ver ejemplos de imágenes automáticas basadas en la red de confrontación de generación condicional (CGAN) Tenemos una breve descripción de texto breve, es decir, para dar una pregunta de texto, la siguiente figura se basa en el texto por el algoritmo CGAN calculó automáticamente un mapa de texto Aquí podemos ver que la inteligencia artificial no es sólo Puede ser utilizado para reconocer el mundo conocido, pero también puede crear un mundo desconocido.

La aplicación de la red de confrontación tiene un caso de aplicación del fabricante de aeronaves que utiliza la red neuronal de confrontación integrada para diseñar el ala del avión. La estructura del ala del avión tiene una gran cantidad de métodos clásicos de diseño, Proyecciones, combinado con métodos de análisis de elementos finitos para hacer el diseño.Open dijo, no hay posibilidad de romper el paradigma de diseño existente, el diseño de peso más ligero, mayor resistencia del ala? En el pasado se basan en la experiencia, manualmente establecer la dirección del diseño y ha Algunos teoría de la ingeniería del método de diseño, no puedo moverlo al enfoque basado en datos para el diseño Así que diseñaron una red de confrontación a nivel profundo, por la máquina en ausencia de la experiencia artificial en el espacio de solución infinita para explorar el ala Lo sorprendente es que, al igual que el perro Alpha para explorar la gente no pensaba en un milagro, el proceso de diseño para explorar una estructura de ala completamente nueva, esta estructura es que no piensan en ninguna manera El ala también se puede hacer de esta manera, tanto para mantener la fuerza y ​​puede mantener un peso muy ligero.

El laboratorio de inteligencia artificial del MIT desarrolló una tecnología de predicción de video con CGAN, que resolvió el problema diciendo que le di a la computadora mucho video para aprender, pero no hice ninguna etiqueta y luego la computadora para observar los cambios en el contenido de video entre los diversos marcos Después de terminar y luego darle un nuevo video, cuando el video se detenga, puede predecir los próximos dos o tres segundos que este video se convertirá como, el siguiente fotograma siguiente fotograma y luego el siguiente fotograma ¿Qué tipo de capacidad de pronóstico no sólo se puede utilizar en el entretenimiento de cine y televisión, en algunas ocasiones clave, incluso la aplicación de la capacidad de salvar vidas, tales como advertencia peligrosa --- gafas de nuestro pueblo y la interacción del cerebro, para muchas situaciones peligrosas tienen la capacidad de juzgar , Como una persona en la carrera, frente a las mercancías peligrosas, podemos encontrar rápidamente e interferir Más grave, como hace unos años en Xinjiang graves matones en los ataques terroristas públicos Si podemos avanzar dos En segundo lugar, tres segundos para predecir donde los matones serán violentos, y prontamente dar una advertencia, detener, podremos salvar a unos preciosos estudiantes La vida.

Otro ejemplo interesante es la predicción de la acción.Esta es una red de confrontación otra aplicación muy divertida.Adaptive red puede ver el video cuando el personal para predecir la acción de seguimiento, como para ver a dos personas llegaron, se puede adivinar Para el siguiente paso que se acercará a estrechar la mano para ver este video, de acuerdo con este video corto, la computadora será capaz de especular que los dos maestros kiss.We abrió el agujero cerebral, estas tecnologías pueden pensar en una gran cantidad de aplicaciones.

Y algunos de los algoritmos sobre la innovación, incluyendo el fortalecimiento del aprendizaje sobre la innovación, esto es la empresa DeepMind para hacer, creo que muchos de los estudiantes en los primeros años de la máquina roja y blanca jugado juego BrickBreaker.La compañía DeepMind basada en la tecnología de aprendizaje mejorado desarrollado un Programa, no entienden las reglas del juego bajo la premisa de DeepMind dejar que el programa a través de una cámara frente a la pantalla, observar los cambios en la pantalla, tomar la iniciativa para aprender las metas del juego y las reglas del juego y luego darle la tarea tanto como sea posible para obtener la puntuación más alta del juego El programa en el proceso de formación durante todo el juego continúan comprendiendo las habilidades del juego, en el video podemos ver desde el principio para jugar putrefacto hasta el último después de 240 minutos después de la formación se convirtió en el principal maestro, en realidad se encuentra en la pared Cave la pelota en la pared y alrededor de la eyección repetida y destruir automáticamente los ladrillos.

Estos algoritmos e innovaciones de software han abierto el camino a la ruta de la inteligencia artificial general para inspirarnos a crear el futuro de posibilidades infinitas. También vemos a muchos empresarios en este esfuerzo, especialmente digno de respeto por ellos Dedicado a la parte superior del descubrimiento del algoritmo, es en el futuro para darnos más escenarios de aplicación a largo plazo para proporcionar armas de fuego y municiones indispensables.

3 forzar la innovación

El desarrollo del algoritmo no es el desarrollo de la potencia informática, que es la piedra angular de la inteligencia artificial en la parte de la informática, y el aprendizaje de máquinas de hoy en día tiene que depender de una infraestructura muy computacionalmente intensiva - la cantidad de esfuerzo computacional Demasiado, la necesidad de tener una arquitectura de computación especial para hacer frente a la profundidad de aprendizaje de la carga de trabajo de la profundidad de aprendizaje hay dos tipos de tareas de computación, una formación es un razonamiento, estas dos partes tienen un montón de cálculo.

Podemos ver que las acciones de NVIDIA han aumentado siete años en dos años porque los cálculos requeridos por la inteligencia artificial impulsan la demanda de arquitecturas de computación de alta velocidad Hay muchas razones en la nube, incluyendo Microsoft, Amazon, etc. Estas empresas, Huawei ha anunciado la cooperación con el Cámbrico, en el Kirin 970 chip de telefonía móvil por encima del uso de la profundidad de aprendizaje para proporcionar IP, para proporcionar el cálculo de la profundidad para acelerar Intel gastó más de 10.000 millones de dólares para comprar MobileEye y Nervana Systems, Movidius, etc., porque la inteligencia artificial requiere un nuevo hardware para soportar la computación inteligente en el centro de datos y al final.

Esta evolución sigue en curso. Vemos que desde el original usamos la CPU, hasta ahora de diversas maneras, con la GPU y FPGA con un chip ASIC dedicado, se puede decir que una variedad de ruta técnica florece para encajar en diferentes Un representante típico de un arranque de chip de inteligencia artificial es Wave Computing, que integra más de 16.000 procesadores independientes en un chip de flujo de datos con un enfoque super-paralelo, y luego 16 chips se cargan como un grupo A la máquina, por lo que es un servidor hay 25 mil 6 mil nuclear, esta innovación de la arquitectura es sin precedentes. Con el Google TPU, incluyendo el tamaño de la innovación de la empresa, vemos el sin parar en la aparición de artificial Las innovaciones en el campo de los chips inteligentes serán un prerrequisito indispensable para aplicaciones dinámicas de inteligencia artificial y un fuerte apoyo.

Y en el mayor número de equipos en el lado de la inteligencia inteligente, chip de inteligencia artificial se ha aplicado en el dispositivo de teléfono móvil.Apple iPhone X CPU, A11 chip biónico incorporado motor neuronal rendimiento de la computación de 0.6TFlops, es decir, Es un equipo de alto rendimiento capaz de realizar 600 millones de operaciones de punto flotante por segundo El recién anunciado chip de smartphone Huawei, el unicornio 970, tiene una capacidad de computación inteligente de hasta 1.92 trillones de veces por segundo, pero incluso con tal poder de computación , La creciente demanda de aplicaciones inteligentes es capaz de devorar estas nuevas arquitecturas para proporcionarnos el cálculo, por lo que también queremos ver que la nueva arquitectura de la computación continúa emergiendo, tener poder de cálculo más potente, menor potencia Consumo para satisfacer las necesidades de una amplia variedad de aplicaciones que surgirán para grandes requerimientos computacionales.

Todos estos elementos se resumen en el campo de la inteligencia artificial en el campo de algoritmos, hardware y escenarios de aplicación de las tres principales innovaciones, y estos tres aspectos de la innovación también se están promoviendo mutuamente.Esto se refiere hoy a la importancia de la inteligencia artificial en la cumbre de semiconductores , El desarrollo de la industria de la inteligencia artificial ha dejado la industria de los semiconductores como un pilar importante, es imposible desarrollar.Only a la innovación de la escena como la conducción, el hardware y la innovación de software como el apoyo, la inteligencia artificial puede crear nuevo maravilloso. ¡Ayúdenos a presenciar una combinación más dura y suave de inteligencia artificial maravillosa!

2016 GoodChinaBrand | ICP: 12011751 | China Exports