왜 이렇게 빨 갛습니다 : GPU 컴퓨팅에 대한 이야기

인공 지능 응용 프로그램의 흥분을 위해, 24 세의 기술 분야에서 가장 인기있는 기업 중 하나가되었다, 주식은 지난 2 년 동안, 7 배 이상, 100 억 달러, 매출의 급증의 마지막 분기에 도달 급증했다 56 %.

홍채 뒤에는 호기심이 생길 수 있습니다. 이제는 '그래픽 처리 장치'의 화면 이미지를 그리는 일만하면됩니다. 이제 복잡한 컴퓨팅 문제를 해결할 수있는 이유는 무엇입니까? GPU 전체 상승, 대답은 매우 분명합니다. 강박 장애 "와 약 10 년 전의 핵심 내기.

'강박 장애 (obsessive-compulsive disorder)'의 가죽 헤게모니 회장

이 강한 성장 회사의 설립자 겸 CEO 인 Jen-Hsun Huang은 전략적인 직관력이 뛰어나고 그의 성격은 가혹하며 종종 어두운 옷을 입기 때문에 누군가 그를 데려 간다. 애플의 늦은 CEO 인 스티브 잡스 (스티브 잡스와 비교할 때, Jen-Hsun은 회사에 매력적인 새 본사 건물을 제안했지만 회사는 조만간 새로운 본사에 배치 될 예정이다)

창 렌킨 (Huang Renxun) 설립자 겸 CEO

Huang Renxun은 올해로 54 세가되어 항상 검은 색이나 가죽 자켓을 입고 사무실을 걷기 때문에 직원은 일반적으로 페이스를 따라 가기가 어렵습니다. 그는 대만에서 태어 났으며 미국에서 살고있는 어린 시절과 가족입니다. 특히 탁구를 좋아하고 나중에 빠른 속도로 진행되는 선수가되었습니다. "패들 팰리스의 CEO는 자신이 신속하고 능력 있고 능력이 있다고 말하면서, 국립 탁구 선수입니다.

Stanford 졸업 후 2 년째에는 Sun Microsystems의 전 엔지니어 Chris Malachowsky와 Curtis Priem이 그래픽 카드 제조 회사 인 NVIDIA를 공동 설립하여 전자 공학 전문 지식을 배우기 시작했습니다.

곧, 영국의 Weida는 시장에 신속하게 자리를 잡았습니다. 1999 년에 치열한 경쟁을 벌인 그래픽 카드 제조업체 47 곳과 다른 회사 중 하나가 인수되거나 폐쇄되어 AMD 만 남았습니다 그리고 영국 Weida 두 강한 싸움.

생존을 위해 황 렌쿤 (Huang Renxun)은 직원들이 집중해야한다고 경고했다. 그는 항상 열심히 일하지 않으면 회사가 한 달 만에 파산 해 모든 직원이 억압과 긴장을 느끼게 될 것이라고 말했다.

"강박 장애"는 직원들에게 항상 좋은 소식을 전하는 사실에도 반영되어 있으며 1997 년 총회에서 직원 1 백만 달러를 보유하고 있다고 발표했으며 동시에 RIVA 128 칩을 장착했다 이 뉴스의 제작은 직원이 항상 방해 받고 있다고 느끼게합니다. 그런 다음 주머니에서 종이를 꺼내서 3 천만 달러짜리 그래픽 카드 주문에 따라 STB 시스템을 설명했습니다. NVIDIA는 처음입니다 같은 큰 목록을받은뿐만 아니라 NVIDIA 그래픽 칩이 HP와 DELL 같은 컴퓨터 제조 업체 시장을 성공적으로 열었습니다 때, 회사는 위에서 아래로 응원.

1998 년에 처음으로 영국인은 사분기 이익의 부족한 부분을 만회했다. 황 렌 스크 (Huang Renxun)가 여전히 70 명의 직원을 고용하고 있었을 때 축하하기 위해 1 달러짜리 지폐를 만들었다.

황 렌쿤 (Huang Renxun)의 "강박 장애 (obsessive-compulsive disorder)"는 아직도 매우 효과적입니다. 목록 작성 전후에 영국의 Weida는 수많은 '죽음'경험을 쌓은 후 칩을 컴퓨터 제조업체에 보낼 때마다 직원들은 항상 즉각적인 조치 마감 기한을 지키고 있습니다. 칩의 대만 생산은 문제를 발견했다, 오히려 또한 돈을 큰 금액을 잃고 완전히 결함이 제품을 복구해야합니다.

황 Renxun의 위기 관리 능력. 그에게 직원의 존경을 받았다 1998 년, 인텔은 엔비디아 그래픽 카드에 경쟁을 도입, 황 Renxun 게임 소프트웨어를 재생할 때 그래픽 성능을 향상시키기 위해 작성하는 직원을 지시 본회의의 시리즈를 조직했다. 나중에 여전히 경쟁 우위를 유지한다. 사실, 그것은 결코 실현되지 엔비디아에서 인텔에서 제조 위협 보인다.

같은 해에, 실리콘 그래픽스는 특허 침해에 대한 엔비디아를 고소했다. 황 Renxun가 유리한 상황을 다시 빠른 제어, 두 회사는 결국 다른 특허를 라이선스하기로 합의했다. SGI는 나중에 또 잉 웨이는 자신의 컴퓨터 시스템 그래픽 칩 기호에 도달 할 수 있습니다. 황 Renxun의 노력은 처음에 엔비디아 도움 자금 조달 라운드는 많은 잠재적 인 투자자를 모으고있다.

황 렌쿤 (Huang Renxun)은 자신의 '신축성을 발휘할 수있다'는 사실을 입증했다. 24 년 동안 회사 창립 이래로 영국의 위다 (Weida)는 새로운 칩 문제 및 경쟁 소송 등 생존을 여러 번 맞아 여러 차례 위기에 직면했다.

영국 세인트 산타 클라라의 새로운 본부 건설에

수년 동안 NVIDIA가 새로운 시장 영역을 확장 할 수 있도록하기 위해 Huang Renxun은 사전 위험 평가 작업을 잘 수행해 왔습니다. 10 년 전 그는 일련의 변경 및 소프트웨어 개발에 대한 베팅을 통해 GPU는 컴퓨터 화면에서 그림을 그리는 것 이외의 복잡한 작업을 처리 할 수 ​​있습니다.

CUDA (Unified Computing Facility)라는이 프로젝트의 연간 비용은 5 억 달러에 달하는 반면, 회사의 총 수익은 5 억 달러에 이르는 것으로 추정된다고 Huang Renxun은 주장했다. CUDA 출시 이래로 약 30 억 달러에, NVIDIA의 모든 지출은 GPU를보다 범용 컴퓨팅 도구로 전환하여 거의 100 억 달러에 달했습니다.

인턴 프로젝트 'CUDA'GPU 제국을 구하십시오

완고한 헤게모니 회장은 그가 정말로 '처녀 자리'라고 의심하지만 CUDA는 오늘 Huang Renxun의 주장에 덧붙여 기여한 사람이있다. 그는 Ian Buck (이안 벅), 현재의 NVIDIA GPU 컴퓨팅 소프트웨어 총 관리자.

Ian Buck은 2004 년에이 회사에 합류하여 CUDA를 만들었습니다.

당시 Ian Buck의 GPU 컴퓨팅 연구는 2000 년에 시작되었습니다. 당시 Stanford University의 Buck과 소규모 팀은 그래픽 프로세서의 성능과 추세를 잘 알고 있었고 GPU는 범용 컴퓨팅 아이디어는 GPU 지원 프로그램에서 시작하는 것입니다.

처음 몇 년 동안, 그들은 매우 큰 어려움을 겪었습니다. 예비 테스트는 GPU를 일반 컴퓨팅에 대한 큰 잠재력을 확인할 수 있지만,이 아이디어를 홍보하는 것은 매우 어렵습니다. 마지막으로 이안 벅 (Ian Buck) 연구팀이 Brook (브룩) 동시에 데이터 병렬 아키텍처 확장 C를 사용하기 위해 널리 사용되는 프로그래밍 모델입니다. 동시에 Brook는 GPU 공용 컴퓨팅의 선구자 프로젝트이기도합니다.

Ivy Buck (오른쪽), NVIDIA GPU 컴퓨팅 소프트웨어 총책임자

2004 년 Stanford University 박사 학생 인 Ian Buck이 영국의 Weida 인턴쉽에 참가하여 관련 하드웨어 및 소프트웨어 엔지니어에게 CUDA 개발의 시작 인 GPGPU 모델을 만들기 시작했습니다. 당시 Buck은 GPU 컴퓨팅 엔진 프로세스 프로그래밍 도전.

가까운 장래에 NVIDIA는 그래픽 칩에 대한 지침을 발행하는 이상한 도구가 아닌 표준 프로그래밍 언어에 대한 지원을 포함하여 소프트웨어 지원을 개발하기 위해 칩을 변경합니다 .Ian Buck의 지도력하에, - CUDA는 일반 컴퓨팅 솔루션에서 세계 최초의 GPU입니다.

CUDA는 그래픽 처리 장치 (GPU)에서 일반적인 컴퓨팅을 위해 NVIDIA에서 개발 한 병렬 컴퓨팅 플랫폼 및 프로그래밍 모델이며 CUDA를 사용하면 개발자는 GPU의 기능을 활용하여 컴퓨팅 응용 프로그램의 속도를 크게 향상시킬 수 있습니다. 실제로 NVIDIA, CUDA 모든 GPU 시리즈의 공통 플랫폼입니다.

NVIDIA Tesla P100의 성능

GPU 가속 응용 프로그램에서는 단일 스레드 성능에 최적화 된 CPU에서 작업 순서가 실행되며 응용 프로그램의 연산 집약적 인 부분은 수천 개의 GPU 코어에서 동시에 실행됩니다 .CUDA를 사용하는 경우, CUDA 툴킷에는 GPU 가속 라이브러리, 컴파일러, 개발 도구 및 CUDA가 포함되어 있습니다. 실행 시간.

CUDA의 핵심 디자인 철학은 컴퓨터의 스레드입니다. 전통적인 CPU 4, 8 및 16 스레드와 비교하여 GPU는 최대 수만 개의 스레드가 될 수 있습니다.

Buck 씨는이 스레드의 관리가 매우 복잡하지만 실제로 프로그래머의 주된 어려움은 이러한 스레드의 관리보다는 이러한 스레드의 이점을 활용하는 방법이라는 것입니다. 초기에 CUDA 성능은 주로 프로그래밍 스태프 병렬로 계산할 수있는 코드 부분을 발견하십시오.

현재 쿠다 (CUDA) 도서관의 발전으로 CUDA 팀은 과학 컴퓨팅 라이브러리에서 사용되는 많은 석유, 가스 및 방위 관련 산업을 개발했으며, 마지막으로 2012 년 Titan Super 컴퓨터는 18,688 개의 Tesla K20 GPU를 코 프로세서로 사용하여 고성능 컴퓨팅에서 GPGPU의 성공적인 홍보와 적용을 보여 주었으며 2011 년부터 상위 500 대 슈퍼 컴퓨터 중 50 대 이상이 GPU를 가속화하는 데 사용되었으며 이 기계는 대부분 Green 500 (글로벌 에너지 슈퍼 컴퓨터 목록) 목록에 포함되어 있습니다.

영국 Weida AI '대량 살상 무기'CUDA 플랫폼 멜론 익은

쿠다 (CUDA)는 점점 더 많은 관심을 받기 시작했으며 쿠다 (CUDA) 어플리케이션 또한 '번성'하고 있습니다.하지만 벅 (Buck)은 유방암 진단 및 진단 시스템이 가장 큰 영향력을 발휘한다고 말했습니다. 전통적인 방법과 비교하여 CUDA 프로그래밍 지원 국립 암 연구소 (National Cancer Institute) 자료에 따르면 CUDA 기반 시스템은 단백질 리간드 계산 (암 및 치매 용 신약 연구 및 개발 용) 만 실행하고있는 반면, 테슬라 GPU를 사용하면 유방암을 조기에 발견 할 수 있습니다. 원래 1/12 시간이 필요합니다.

NVIDIA의 새로운 그래픽 칩인 Volta는 개발 비용을 30 억 달러로 예상했습니다.

벅은 또한 많은 산업 분야의 사람들로부터 성과를 희생하고 새로운 언어를 받아들이지 않겠다는 것을 이전에 배웠다고 말했다. 관련 프로그래머를위한 훌륭한 입문 경험을 제공 할 수 있도록 CUDA CUDA는 인기있는 C 언어를 기본으로 채택했습니다.

이런 식으로 프로그래머는 특정 디스플레이 칩 명령어 또는 특수 구조를 배울 필요가 없으며 GPU에서 실행되는 프로그램을 작성할 수 있습니다. 이는 확실히 프로그래머 간의 CUDA 인기에 기여했습니다.

산타 클라라 공원, 캘리포니아의 데모 룸

이 회사는 또한 모든 프로젝트, 써드 파티 지원 및 개발자 마케팅 활동에 대한 GPU 컴퓨팅을 책임지고 있으며, NVIDIA와 자체 소비자 용 GPU 및 고급 제품이 CUDA를 지원한다고 회상했습니다. 즉, 연구원, 학생이 노트북이나 데스크톱을 사용하는 한 학교 실험실과 기숙사에서 소프트웨어를 개발할 수 있습니다.

또한 NVIDIA는 학생들에게 최신 프로그래밍 기법을 가르치는 코스를 제공하는 많은 대학을 설득했으며, 프로그래머는 GPU를 기후 모델링, 석유 및 가스 탐사 및 기타 여러 분야에 점진적으로 적용했습니다.

벅 표현, 슈퍼 컴퓨팅 분야에서의 CUDA 성공적인 응용 프로그램은 또한 좋은 의견에 안내하고있다. 현재, 사용자의 피드백을 기반으로 GPU에 엔비디아의 벅 팀은 메모리 관리를 탐구하기 시작했다. CUDA6는 새로운 메모리 관리 소프트웨어를 출시 기능의 CPU 메모리와 GPU 메모리 간의 자동 데이터 전송에 대한 지원. NVIDIA 파스칼 GPU 아키텍처의 2016 년 계획 출시 NVLink, 기존의 표준 PCI-Express를보다 가속화하기 위해 GPU와 CPU 사이의 데이터 전송 속도를 갖춘 것 5 ~ 12 회.

또한 프로그래밍을 더욱 줄이기 위해 Cray, PGI 및 NVIDIA와 같은 주요 HPC 공급 업체는 2011 년 OpenACC 프로그래밍 표준을 도입했습니다.이 표준은 C / C ++ 및 Fortran 프로그래밍을 가능하게하는 표준화 된 고급 코드 주석 세트를 정의합니다 인력은 GPU 가속 코드를 사용하여 실행할 수 있습니다 .2015 년 7 월 NVIDIA는 새로운 OpenACC 무료 도구 모음을 출시하여 관련 연구원이 과학에 더 많은 관심을 기울일 수 있도록했습니다 .Back은 OpenACC의 원래 의도는 사용자가 처음으로 과학자, 그리고 프로그래머.

CUDA가 고객을 확보하는 데 수년이 걸렸지 만 CUDA는 또한 고성능 컴퓨팅 시장에 대한 수익을 달성하는 데 도움을 주었으며 2012 년에는 CUDA와 GPU가 깊은 학습 신경 네트워크와 결합하여 학계에 충격을주었습니다 그 당시 캐나다 토론토 대학의 Geoffrey Hinton은 두 명의 학생들을 데리고 GPU 교육 딥 뉴럴 네트워크 (Deep Neural Network)로 ImageNet 이미지 인식 경연 대회에서 우승했습니다.

벅 (Buck)은이 시간에 프로그래머를 통해 얼굴을 확인하고 전체 학기를 마칠 필요가있는 수많은 이미지의 규칙 교육 시스템을 개발하고 GPU를 통해 몇 주, 며칠 또는 수개월 만에 연구원들이 몇 시간 내에 교육 과정을 완료 할 수 있습니다.

GTC CHINA 2017 사이트

최근 GTC CHINA 2017 회의에서 Huax Renxun과 TensorRT (CUDA GPU 최적화 신경 회로망 컴파일러에 적합) 장면이 공개되었으며, 초당 테슬라 V100 GPU 가속기 TensorRT를 사용하여 최대 5700 개를 식별했습니다 그림, 그리고 지금은 초당 140 그림을 식별 할 수있는 CPU를 사용합니다.

Tesla V100 AI 플랫폼은 현재 BAT, Huawei, Inspur 및 Lenovo를 포함한 많은 중국 기업에서 자체 데이터 센터 및 클라우드를 업그레이드하는 데 사용됩니다. 서비스 인프라.

그러나 Huang Renxun의 배팅은 두 번째로 보람이 없었으며 Tegra 칩은 원래 스마트 폰과 태블릿 PC 용으로 개발되었지만 두 시장에서 모두 작동하지 않았으며 나중에 전략적 목표로만 전환되었습니다.

이제, 압도적 인 대통령은 자동차 제조 업계에 관심을 돌 렸습니다.

<来源: The Information/The New York Times;编译整理: 科技行者>

2016 GoodChinaBrand | ICP: 12011751 | China Exports