寒武紀推出首款雲端AI晶片 | 能否對標英偉達?

第一款商用終端智能處理器IP產品——Cambricon-1A, 該產品作為寒武紀的第一代終端智能處理器IP產品已經被應用於包括華為Mate10, P20, 榮耀10等千萬級智能終端中. 除了1A, 寒武紀已推出的終端智能處理器IP還有1H, 而在今天的發布會上, 寒武紀科技創始人兼CEO陳天石首先發布了第三代終端IP產品 Cambricon 1M.

據介紹, 1M 採用 TSMC 7nm 工藝生產, 8 位運算效能比達 5Tops/watt (每瓦 5 萬億次運算) , 提供三種尺寸的處理器內核 (2Tops/4Tops/8Tops) 以滿足不同場景下不同量級智能處理的需求, 並可通過多核互聯進一步提高處理效能.

另外, 1M不僅延續了前兩代IP產品1H/1A的完備性, 單個處理器核即可支援 CNN, RNN, SOM 等多種深度學習模型, 1M還支援 SVM, k-NN, k-Means, 決策樹等經典機器學習演算法.

還有值得一提的是, 1M性能超越已被廣泛使用1A的十倍, 性能的提升使其支援終端設備進行本地訓練, 可為視覺, 語音, 自然語言處理等任務提供高效計算平台, 將應用於智能手機, 智能音箱, 攝像頭, 自動駕駛等領域. 陳天石表示: '1M是全球第一款支援本地機器學習訓練的智能處理器產品, 這意味著使用 1M 的設備可以根據用戶行為對應用進行個性化定製. '

至於產品的具體落地, 陳天石表示搭載1H的產品的終端今年會發布, 更多的資訊目前暫不方便透露.

不過寒武紀最早的投資方科大訊飛在發布會上介紹了其餘寒武紀深度合作的項目. 據介紹, 一小時的語音數據在一個傳統處理器上進行智能應用處理, 需要一萬小時才能完成, 因此科大訊飛一直在跟蹤人工智慧專用晶片的前沿進展.

2014年科大訊飛就開始與寒武紀的早期研究團隊開始溝通相關語音演算法在處理器上的實現, 並在2016年的天使輪注資寒武紀, 2017年開始在寒武紀晶片上進行應用測試.

發布會上科大訊飛披露的測試結果顯示, 寒武紀處理器在語音智能處理的能耗效率領先競爭對手雲端GPU方案5倍以上, 語音本地識別準確率相對於傳統處理器也有9.8%的提升.


寒武紀首款雲端智能晶片MLU100

首款雲端智能晶片MLU 100發布, 能否對標英偉達?

相比1M的推出, 陳天石與其導師陳國良共同發布的寒武紀首款雲端智能晶片Cambricon MLU100才是本次發布會的焦點. 陳天石表示, 三年前我們就開始了兩顆晶片的研發, 我們時刻準備著將寒武紀的產品放入雲端.

雷鋒網了解, MLU100採用寒武紀最新的MLUv01架構和TSMC 16nm工藝, 可工作在平衡模式 (1GHz主頻) 和高性能模式 (1.3GHz主頻) , 平衡模式下等效理論峰值速度達每秒128萬億次定點運算, 高性能模式下等效理論峰值速度達每秒166.4萬億次定點運算, 但典型板級功耗為80瓦, 峰值功耗不超過110瓦.

陳天石還表示, 與寒武紀系列終端處理器一樣, MLU100雲端晶片也延續了寒武紀產品通用性的特點, 支援各類深度學習和經典機器學習演算法, 滿足視覺, 語音, 自然語言處理, 經典數據挖掘等領域複雜場景下 (如大數據量, 多任務, 多模態, 低延時, 高通量) 的雲端智能處理需求.

今天發布會上, 搭載MLU100的板卡也一起亮相, 該板卡使用PCIe介面, 外形設計靈感來自於寒武紀地質時代的遠古海洋生物三葉蟲, 以黑色, 藍色為主色調. 基於MLU100智能處理卡, 聯想推出了ThinkSystem SR650, 該雲端智能伺服器將支撐聯想客戶在機器學習/VDI/虛擬化/雲/資料庫/分析/SAP等方向的需求; 中科曙光也同步推出了升級的 'PHANERON' , 該伺服器性能更為強勁, 支援2-10塊寒武紀MLU處理卡, 能靈活應對不同的智能應用負載.

至於首款雲端智能晶片的性能到底有多強, 陳天石在發布會現場公布了在R-CNN演算法下MLU100與Tesla V100和Tesla P4的計算延遲對比, 數據顯示MLU100的計算延遲為125ms, Tesla V100的延遲為174ms, Tesla P4的延遲為1069ms, 結果顯而易見.

不過, 雷鋒網認為人工智慧的實現硬體只是一方面, 軟體與硬體的協同工作也十分關鍵. 可以看到的是, 寒武紀從 2016 年起逐步推出了寒武紀 NeuWare 軟體工具鏈, 該平台終端和雲端產品均支援, 可以實現對 tensorflow, caffe 和 mxnet 的 API 相容, 同時提供寒武紀專門的高性庫, 可以方便地進行智能應用的開發, 遷移和調優. 可以方便地進行智能應用的開發遷移和調優, 並通過了千萬量級用戶大規模商用的檢驗.

但目前英偉達GPU在雲伺服器中佔據優勢, 一方面是英偉達是傳統的GPU大廠, 具有硬體優勢, 另外開發者可以使用C語言為英偉達CUDA架構編寫程序, 強大的硬體以及易用的開發軟體使其對開發者有更大的吸引力. 相比較而言, 英偉達對CUDA投入的時間和資金更多, 也更加完善和成熟, 寒武紀想真正在雲端人工智慧晶片對標英偉達, 目前來看現實嗎?

北極光創投董事總經理楊磊告訴雷鋒網, '我沒有見過一個晶片創業公司做同時發布兩個產品的發布會, 只有你的體量到了英偉達這種水平, 它的GTC可能會有幾個產品同時發布. 一家晶片創業公司同時發布幾個產品, 我覺得是一個比較有挑戰的事情. '

'我們投資的公司通常是在一個垂直領域做得非常深, 專心把一個東西做好, 從而成為英偉達的替代品. ' 北極光投資經理, 前 Intel 人工智慧中國區商務負責人趙顧補充說, '英特爾收了Movidius 做消費級市場, 收了 Mobileye 做車載, 收了Nervana 做雲和邊緣計算的產品. 實際上英特爾這麼大的體量, 也沒辦法同時去支撐不同的市場, 所以說不做深我覺得未來是沒有競爭力的.

'我們的策略就是在不同的垂直市場把它做深, 而且要真正做到全棧的東西給到用戶, 能讓它真正應用. Movidius 這樣的公司在中國的市場最大的挑戰就是不能提供一個完整的解決方案, 所以就沒辦法規模化. ' 趙顧同時表示.

寒武紀實現雲到端的覆蓋 未來計劃發布編程語言

在此, 我們暫不更進一步探討寒武紀的產品目前能否對標英偉達, 可以明確的是寒武紀雲端智能晶片的推出使其實現了由端到雲的覆蓋. 陳天石表示, 過去大部分晶片廠商都是主攻端或者雲, 兩者兼顧的很少. 因為端雲的任務生態都區別比較大, 但是智能時代我們認為這個局面會被打破, 端和雲的AI任務是一體的, 編程和使用的生態也是一致的.

作為通用機器學習晶片的廠商, 寒武紀要端雲結合共同推動生態. 寒武紀未來還計劃發布自己的編程語言, 希望合作夥伴能夠基於這套軟體系統發布產品.

2016 GoodChinaBrand | ICP: 12011751 | China Exports