¿Por qué es tan rojo: hablar de la historia detrás de la computación GPU

Para la aplicación de la inteligencia artificial excitación, permitiendo de 24 años de edad, Nvidia ha convertido en uno de los sectores de tecnología de la empresa más popular, precios de las acciones se dispararon en los últimos dos años, aumentaron más de siete veces a $ 100 mil millones, una cuarta parte de los ingresos aumentó reciente 56%.

Detrás de la fuerza irresistible, usted puede preguntarse, una vez a la única 'unidad de procesamiento gráfico' responsable dibujar una imagen en la pantalla, ahora por qué puede asumir la responsabilidad de resolver problemas computacionales complejos? GPU aumento general, la respuesta de Nvidia es clara, un ' Trastorno obsesivo-compulsivo "y una apuesta clave hace más de una década.

Hegemonía de cuero presidente del "trastorno obsesivo-compulsivo"

Jen-Hsun Huang, fundador y CEO de esta empresa de crecimiento fuerte, tiene una intuición estratégica aguda, su personalidad es áspera ya menudo usan ropa oscura, por lo que alguien lo lleva En comparación con el ex CEO de Apple Steve Jobs (con Steve Jobs, Jen-Hsun también propuso a la compañía para crear un nuevo y atractivo edificio de la sede, la compañía pronto estará en la nueva sede)

Fundador y CEO Huang Renxun

Huang Renxun ha sido de 54 años de edad este año, siempre un negro, pero también a menudo se visten chaqueta de cuero, caminando en la oficina, el personal es generalmente difícil de mantener su ritmo.El nació en Taiwan, la infancia y la familia que viven en los Estados Unidos. Le gustaba mucho jugar al tenis de mesa y luego se convirtió en un jugador de ritmo rápido ". El CEO de Paddle Palace también dijo que era rápido, capaz y capaz, Jugador de tenis de mesa nacional superior.

Después de graduarse de Stanford, el segundo año comenzó a aprender la maestría de la ingeniería electrónica, con los ingenieros anteriores de Sun Microsystems Chris Malachowsky y Curtis Priem co-fundaron a la compañía de la tarjeta gráfica NVIDIA.

Pronto, los británicos Weida rápidamente poner un lugar en el market.With 47 fabricantes de tarjetas gráficas después de la feroz competencia en el mercado en 1999, y otras empresas o se adquirió, o que se cierra, dejando sólo AMD sigue siendo Y los británicos Weida dos pelea fuerte.

Para sobrevivir, Huang Renxun advirtió que el personal debe estar enfocado. Él siempre dijo que si no trabajas duro, la compañía puede estar en quiebra en un mes, lo que hace que cada empleado sienta la opresión y la tensión.

"El trastorno obsesivo-compulsivo" también se refleja en el hecho de que siempre anuncia buenas noticias a sus empleados, y en una sesión plenaria en 1997, anunció a todos los empleados que la compañía había retenido $ 1 millón en fondos.Al mismo tiempo, la empresa había puesto el chip RIVA 128 Puso la producción de esta noticia siempre se hace el personal se siente muy perturbado. Luego sacó un pedazo de papel de su bolsillo, para explicar esto es el sistema STB bajo la orden de tarjeta gráfica $ 30 millones.Ésa es la primera vez que NVIDIA Recibió una lista tan grande, pero también marca el chip de gráficos NVIDIA se ha abierto con éxito el HP y DELL tales mercado de los fabricantes de computadoras, cuando la compañía de arriba a abajo animando.

En 1998, los británicos por primera vez para compensar la falta de ganancias trimestrales, cuando Huang Renxun todavía en la oficina a 70 empleados cada uno hizo un billete de un dólar para celebrar.

Huang Renxun "trastorno obsesivo-compulsivo" sigue siendo muy eficaz.Y antes y después de la lista, el británico Weida después de una serie de "morir" experiencia.Cada vez que el chip enviado al fabricante de computadoras, los empleados están siempre frente a la fecha límite de acción inmediata plazo. La producción de Taiwán de la viruta se detectó un problema, preferiría perder una gran suma de dinero también debe ser totalmente recuperado los productos defectuosos.

capacidad de gestión de crisis de Huang Renxun le valió el respeto de los empleados. En 1998, Intel introdujo una competición con tarjeta gráfica Nvidia, Huang Renxun organizó una serie de sesiones plenarias instruir a los empleados a escribir para mejorar el rendimiento de gráficos al jugar juegos de software. más tarde aún así mantener una ventaja competitiva. de hecho, parece que la amenaza fabricado por Intel en Nvidia nunca se dio cuenta.

En el mismo año, Silicon Graphics demandó a Nvidia por violación de patentes. Huang Renxun control de nuevo rápida de la situación favorable, las dos compañías finalmente aceptó licenciar otras patentes. SGI más tarde también dejó Ying-Wei llegó a su propia preferencia del sistema informático de chips gráficos. Esfuerzos de Huang Renxun también ayudan a Nvidia en el primer ronda de financiación ha atraído a muchos inversores potenciales.

Huang Renxun ha demostrado que su "puede ser capaz de estirar." Desde la creación de la empresa durante 24 años, el británico Weida varias veces frente a la supervivencia de la situación, incluidos los problemas de nuevos chips, y la demanda rival, etc, Huang Renxun han llevado al personal a través de la crisis.

En la construcción de la nueva sede del British St. Santa Clara

A lo largo de los años, con el fin de permitir a NVIDIA expandir nuevas áreas de mercado, Huang Renxun ha estado haciendo un buen trabajo por adelantado trabajo de evaluación de riesgos. Hace 10 años, hizo una apuesta crucial: apostar por una serie de cambios y desarrollo de software, La GPU puede manejar tareas más complejas además de pintar en una pantalla de computadora.

Huang Renxun, que estima que el proyecto, que se llama CUDA (Unified Computing Facility), cuesta 500 millones de dólares al año, mientras que los ingresos totales de la compañía Alrededor de 3.000 millones de dólares desde la introducción de CUDA, todo el gasto de NVIDIA ha convertido a la GPU en una herramienta informática de uso más general, con un total de casi 10.000 millones de dólares.

Intern Proyecto 'CUDA' Salva el imperio de la GPU

Así que el presidente de la hegemonía obstinada realmente duda de que es 'Virgo', pero CUDA hizo hoy todos los resultados, además de la insistencia de Huang Renxun, hay una persona contribuida, es Ian Buck (Ian Buck), la actual GPU de NVIDIA informática Gerente general de software.

Ian Buck se unió a la compañía en 2004 y creó CUDA

La investigación de Ian Buck sobre computación GPU comenzó en 2000. En ese momento Buck y su pequeño equipo en la Universidad de Stanford eran muy conscientes del rendimiento y las tendencias del procesador gráfico, y dijo que la GPU se utilizó para la computación de propósito general La idea es comenzar desde el soporte GPU programable.

A pesar de la prueba preliminar puede confirmar la GPU para la informática general gran potencial para promover esta idea es muy difícil. Finalmente, en 2003, dirigido por Ian Buck equipo de investigación lanzado Brook, Este es el primer modelo de programación ampliamente utilizado para el uso de las extensiones de arquitectura paralela de datos C. Al mismo tiempo, Brook es también un proyecto pionero para la computación común de GPU.

Ivy Buck (derecha), gerente general del software de computación GPU de NVIDIA

En 2004, la Universidad de Stanford estudiante de doctorado Ian Buck entrar NVIDIA prácticas, se inicia una colección de ingenieros de hardware y software relacionado para crear el modelo de GPGPU, que es el comienzo de la investigación y el desarrollo de CUDA. En ese momento, Buck ha estado involucrado en numerosos implica simplificar el proceso de utilización de la programación del motor computacional de la GPU Desafío.

Poco después, Nvidia hará cambios en su chip, ayudas de software desarrollados, incluyendo soporte para lenguajes de programación estándar, herramienta misteriosa para emitir instrucciones al chip de gráficos en lugar de utilizarse. En Ian Buck llevó, en 2006 lanzó oficialmente --CUDA, este es un soluciones de computación de propósito general en la primera GPU del mundo.

CUDA es una plataforma de computación paralela y un modelo de programación desarrollado por NVIDIA para la computación general en unidades de procesamiento gráfico (GPU), y con CUDA, los desarrolladores pueden acelerar significativamente las aplicaciones informáticas aprovechando las capacidades de la GPU. Es una plataforma común para todas las series de GPU.

Rendimiento de la NVIDIA Tesla P100

En las aplicaciones aceleradas por GPU, la secuencia de cargas de trabajo se ejecuta en la CPU, optimizada para el rendimiento de un solo subproceso y la parte de la aplicación que se ejecuta en cientos de núcleos de GPU en paralelo, El personal está programado en lenguajes populares como C, C ++, Fortran, Python y MATLAB y expresa el paralelismo en varias palabras clave básicas.El kit de herramientas CUDA incluye bibliotecas de aceleración de GPU, compiladores, herramientas de desarrollo y CUDA Tiempo de ejecución.

La filosofía de diseño central de CUDA es el hilo de rosca en la computadora. Comparado con los usos tradicionales de la CPU 4, 8 y 16, la GPU puede tener hasta decenas de miles de hilos.

Buck dijo que parece que la gestión de estos hilos es una cosa muy complicada, pero en realidad, la principal dificultad de los programadores es cómo jugar las ventajas de estos hilos, en lugar de la gestión de estos hilos.En primer lugar, el rendimiento CUDA depende principalmente del personal de programación Descubra la parte del código que se puede calcular en paralelo.

En la actualidad, con el desarrollo de la biblioteca CUDA, este trabajo comenzó a ser más automatizado.CUDA equipo ha desarrollado una gran cantidad de petróleo, gas y defensa y otras industrias relacionadas utilizados por la biblioteca de computación científica.Finalmente, 2012 lanzó Titan Super La computadora utilizó 18.688 GPUs Tesla K20 como coprocesador, marcando la exitosa promoción y aplicación de GPGPU en computación de alto rendimiento.Al menos 50 de los superordenadores Top 500 fueron utilizados para acelerar la GPU desde 2011, mientras que Estas máquinas también se encuentran principalmente en la lista de Green 500 (lista mundial de supercomputadores de energía).

British Weida AI 'armas de destrucción masiva' CUDA plataforma melón madura

CUDA comenzó a recibir más y más atención, la aplicación de CUDA también es "floreciente." Pero Buck dijo que uno de los más influyentes es el sistema de detección y diagnóstico del cáncer de mama.Compared con el método tradicional, utilizando el apoyo de programación CUDA Tesla GPU, los médicos pueden encontrar el cáncer de mama con anterioridad y con mayor precisión, mientras que los datos del Instituto Nacional del Cáncer muestran que los sistemas basados ​​en CUDA están ejecutando sólo los cálculos de ligando de proteínas (para la investigación y el desarrollo de nuevos fármacos para el cáncer y la demencia) Necesita el 1/12 original del tiempo.

El nuevo chip gráfico de NVIDIA, Volta, estimó un costo de desarrollo de hasta US $ 3 mil millones

Buck también dijo que previamente había aprendido de personas de muchas industrias que preferirían sacrificar el rendimiento y no aceptarían un nuevo idioma.Para poder proporcionar una buena experiencia introductoria para los programadores relevantes, era fácil promover CUDA , CUDA ha adoptado el popular lenguaje C como base.

De esta manera, los programadores no necesitan aprender una pantalla específica instrucciones chip o estructura especial, puede escribir el programa que se ejecuta en la GPU, que sin duda contribuyó a la popularidad de CUDA entre los programadores.

Una sala de demostración en el Parque Santa Clara, California

Además, la empresa tomó una decisión también es muy importante. Ahora es responsable de la computación GPU para todos los proyectos, el apoyo de terceros y las actividades de marketing para desarrolladores, lan Buck recordó que NVIDIA y su propia clase de consumo GPU y productos de gama alta CUDA apoyo Esto significa que mientras los investigadores, los estudiantes tienen un ordenador portátil o de escritorio, puede en los laboratorios de la escuela y dormitorios para desarrollar software.

NVIDIA también persuadió a muchas universidades para ofrecer cursos para enseñar a los estudiantes las últimas técnicas de programación de su empresa, y los programadores han aplicado gradualmente la GPU para el modelado del clima, la exploración de petróleo y gas y muchas otras áreas.

Buck dijo que CUDA en el campo de la aplicación exitosa de supercomputación también dio paso a un muy buen uso de la retroalimentación.En la actualidad, Buck en el equipo de NVIDIA basado en la retroalimentación de los usuarios comenzó a explorar la gestión de memoria GPU.CUDA6 lanzó un nuevo software de gestión de memoria Características que soportan la transferencia automática de datos entre la memoria de la CPU y la GPU La NVIDIA Pascal GPU, disponible en 2016, ofrecerá NVLink para acelerar la transferencia de datos entre la GPU y la CPU más rápido que los estándares PCI-Express existentes 5 a 12 veces.

Además, para reducir aún más la programación de esfuerzo, Cray, IGP y NVIDIA y otros proveedores líderes de HPC en 2011 puso en marcha la programación estándar OpenACC, que define un conjunto de códigos de comentarios, de alto nivel estandarizado, el C / C ++ y programación Fortran puede tomar ventaja de código de aceleración de GPU corre. Nvidia en julio de 2015 pero lanzado un nuevo kit gratuito OpenACC, por lo que los investigadores pertinentes a prestar más atención a la ciencia misma. Buck también subrayado en repetidas ocasiones, OpenACC intención original es permitir que, ante todo, de los usuarios Un científico, y luego un programador.

CUDA también ayudó a la empresa a lograr un retorno en el mercado de computación de alto rendimiento.En 2012, CUDA y GPU combinado con profundas redes neuronales de aprendizaje sorprendió a los académicos En ese momento, Geoffrey Hinton de la Universidad de Toronto, Canadá, tomó dos estudiantes y ganó el concurso ImageNet Image Recognition Con GPU Training Deep Neural Network.

Buck dijo que por este tiempo, a través del programador para desarrollar un sistema de formación de reglas en millones de imágenes para identificar una cara, la necesidad de pasar un semestre completo, ya través de la GPU, los investigadores en pocas semanas, unos días o incluso varios En cuestión de horas puede completar el proceso de formación.

Sitio de GTC CHINA 2017

Esta escena, en la reciente conferencia GTC CHINA 2017, Huang Renxun con TensorRT (un adecuado para CUDA GPU optimizado compilador de redes neuronales) se demostró, con Tesla V100 GPU acelerador TensorRT por segundo para identificar hasta 5700 Imagen, y ahora utilizar la CPU sólo es capaz de identificar 140 imágenes por segundo.

La plataforma Tesla V100 AI es actualmente utilizada por muchas compañías chinas, incluyendo BAT, Huawei, Inspur y Lenovo, para actualizar sus propios centros de datos y nubes. Infraestructura de servicios.

Sin embargo, las apuestas bajo Huang Renxun no son gratificantes por segunda vez, y el chip Tegra fue desarrollado originalmente para smartphones y Tablet PCs, pero no funcionó en ambos mercados, y más tarde cambió sólo a objetivos estratégicos.

Ahora, el presidente autoritario volvió su atención a la industria de fabricación de automóviles.

<来源: The Information/The New York Times;编译整理: 科技行者>

2016 GoodChinaBrand | ICP: 12011751 | China Exports