融合人工智慧和HPC, 英偉達這次想做什麼?

計算的世界已經改變了, CPU的擴張已經變慢, 而計算力的需求急速上升. 但是, 擴充CPU的作法已經不合時宜, 且打造高效能運算(HPC)和AI的伺服器複雜度不停攀升, 幾乎已到了系統設計的極限.

如何為這種不可能解決的問題找出方法, 在5月30日舉行的GTC Taiwan 2018大會上Nvidia首席執行官Jensen Huang (黃仁勳) 給出了自己的答案.

NVIDIA的平台野望

回顧NVIDIA發展曆程, 從單純地推出GPU, 到協助國內外廠商打造GPU, 再到提升消費者對計算機遊戲的娛樂體驗. 雖然曾在智能手機市場失利, 但近幾年開始積極布局AI領域, 也開始朝數據中心, 車用領域發展.

從業務架構來說, NVIDIA先是將90% 的研發支出都投入到GPU 架構和CUDA 軟體平台, 繼而將這種模式應用到各個平台: 遊戲, 數據中心, 人工智慧以及自動駕駛.

NVIDIA在GPU市場一直處於領先地位, 遊戲業是GPU 最大的用戶來源. 而數據中心則是其增長最快的業務市場.

過去三年裡, 該部分業務收入年平均增長率85%, 2018財年增長率為133%. 這些增長來源於HPC (高性能計算機群) , 雲計算公司和AI 研究者等多種垂直領域.

在AI 技術方面, NVIDIA已經領先於其他競爭對手. 2017年6月, 英偉達發布了下一代擁有Tensor cores的Volta GPU, 依靠深度學習, Volta 比前代Pascal 快了5倍. Volta 已經被所有主流雲計算供應商和伺服器製造商採用.

此次通過發布NVIDIA HGX-2, NVIDIA正式將人工智慧和高性能計算融合到一個平台中.

據了解, HGX-2作為雲伺服器平台, 具備多精度計算能力, 支援面向科學計算和類比的高精度FP64和FP32計算, 也支援AI訓練和推理所用的FP16和INT8精度. HGX-2執行AI訓練的速度, 在ResNet-50基準上達到了每秒15500張圖片, 相當於300台只裝了CPU的伺服器.

GPU運算時代已經來臨

在此次GTC Taiwan中, 黃仁勳還表示, 未來10年內, 每年對於運算需求的規模將成長100倍, 同時預期在摩爾定律逐漸衰減的現狀下, 全球前50大超級電腦的GPU運算量將在未來5年內成長15倍, 同時以GPU加速運算的方式將成為延展摩爾定律的主要模式.

目前超級電腦已經成為現代科學發展重要工具, 分別在分子建構, 量子化學, 量子力學, 天氣預報, 氣象研究, 能源探索, 物理類比, 數據分析與人工智慧技術的發展過程中扮演重要角色, 並且提供百萬億次或百億等級運算效能.

而就OpenAI統計顯示, 未來5年內人工智慧運算模型將成長30萬倍, 相比摩爾定律預期成長速度快3萬倍. 藉由GPU加速能力, 將可讓數據, 演算程式複雜度大幅提升, 藉此解決過往人力無法解決的運算需求.

黃仁勳再次強調, 過去NVIDIA創造CUDA運算模式所帶動的加速效益, 同時說明未來藉由GPU加速運算的模式將會持續擴大, 預期在2028年全球運算需求將等同1000萬組Volta架構GPU所推動效能. 若以傳統通過多組CPU堆疊構成超級電腦等級運算能力, 將會佔據大規模空間及高額電力花費, 若以GPU替換的話, 則可節省更多空間與電力損耗, 同時帶來更高加速效果.

另外, 黃仁勳表示NVIDIA 正式啟動全球頂尖 ODM 夥伴合作計劃, 鴻海精密, 英業達, 廣達電腦和緯創這些全球設計生產大廠都將成為合作夥伴, 加速因應 AI 雲端運算的各種需求.

統一計算平台NVIDIA HGX-2

2018年5月30日, 英偉達宣布推出首款同時適用於人工智慧和高性能計算的統一計算平台NVIDIA HGX-2.

從產品線來看, HGX-2 是去年HGX-1 的升級版, 後者也是亞馬遜AWS, Facebook 以及微軟等雲服務的參考架構, 而HGX-2 還在雲服務平台之外, 還能被應用到HPC (高性能計算機) , 成為業界首個可針對跨領域計算應用的標準平台.

HGX-2雲伺服器平台具備多精度計算能力, 可提供獨特的靈活性, 為未來的計算提供有力支援. 英偉達稱該平台能夠針對科學計算和類比進行高精度的FP64和FP32運算, 並針對AI訓練和推理進行FP16和Int8運算, 多樣功能性可滿足現今越來越多融合HPC和AI的應用之需.

HGX-2 核心部分使用16 個Volta 張量核心GPU, 通過NVSwitch 互聯結構組成一個龐大的核心群. 作為單一的巨型GPU, HGX-2 提供2 petaflops 的AI 性能. 而使用HGX-2 構建的第一個系統是最近發布的NVIDIA DGX-2 .

黃仁勳指出, HGX-2隸屬NVIDIA GPU加速伺服器平台系列產品之一, 該系列產品串連整個數據中心伺服器體系, 適合每個大型市場, 能因應不同AI, 高效能運算及加速運算作業建議最適 GPU 與 CPU 配置組合. 像是HGX-T針對超大規模訓練及HPC; HGX-1針對大規模推論及智能影像分析功能(IVA); 以及SCX-E針對數據中心, HPC, IVA, 虛擬案頭基礎架構(VDI)等.

黃仁勳說: '搭載Tensor Core GPU的英偉達HGX-2為行業帶來了一款強大, 通用的計算平台, 能將HPC和AI結合起來, 解決這個世界面臨的巨大挑戰. '

據了解, 全球四大ODM廠商富士康, 英業達, 廣達和緯創也正在設計基於HGX-2的系統, 有望於下半年在全球幾家最大型的雲數據中心投入使用.

十多年前, NVIDIA決定從一家圖形晶片公司轉型成運算公司, 並開始一磚一瓦地建構出促進GPU運算普及所需的基礎建設跟生態系統.

十多年後的今天, NVIDIA轉型的成果已經有目共睹. 從最尖端的物理, 醫學研究, 到當前最熱門的人工智慧和自動駕駛研發, NVIDIA的平台不斷為開發人員提供更高的運算效能, 也成為推動科技進步的引擎!

2016 GoodChinaBrand | ICP: 12011751 | China Exports