業界領先的智能晶片設計公司寒武紀科技今天於上海發布了Cambricon MLU100 雲端智能晶片和板卡產品, 寒武紀1M終端智能處理器 IP 產品. 聯想, 曙光和科大訊飛作為寒武紀的合作夥伴同時發布了基於寒武紀晶片的應用產品.
寒武紀由端入雲, 樹立AI晶片新標杆
在發布會上, 寒武紀公司創始人兼CEO陳天石博士發表了主旨演講. 陳天石博士回顧了寒武紀創業的初衷, 並介紹了寒武紀開放, 協作, 共贏的商業理念: 與全球上下遊的合作夥伴緊密合作, 為人類邁向智能時代構建核心物質載體. 在演講中, 陳天石博士正式對外發布了寒武紀的兩款全新產品: 終端智能處理器IP產品寒武紀1M, 雲端智能晶片Cambricon MLU100及其板卡.
寒武紀在2016年推出的第一代終端智能處理器IP產品寒武紀1A是全球第一款商用終端智能處理器IP產品, 已經應用於千萬級智能終端中 (包括華為Mate10, P20和榮耀10等手機) . 這次最新發布的寒武紀1M是公司的第三代IP產品, 在TSMC 7nm工藝下8位運算的效能比達5Tops/watt (每瓦5萬億次運算) , 提供三種規模的處理器核 (2Tops/4Tops/8Tops) 以滿足不同應用場景下不同量級的智能處理需求, 並可通過多核互聯進一步提高性能. 寒武紀1M處理器延續了寒武紀前兩代IP產品 (寒武紀1H/1A) 卓越的完備性, 單個處理器核即可支援CNN, RNN, SOM等多樣化的深度學習模型, 並更進一步支援SVM, k-NN, k-Means, 決策樹等經典機器學習演算法, 支援本地訓練, 為視覺, 語音, 自然語言處理以及各類經典的機器學習任務提供了靈活高效的計算平台, 將廣泛應用於智能手機, 智能音箱, 智能攝像頭, 智能駕駛等不同領域當中.
這場發布會的焦點是首次正式亮相的Cambricon MLU100雲端智能晶片. MLU100採用寒武紀最新的MLUv01架構和TSMC 16nm的先進工藝, 可工作在平衡模式 (1GHz主頻) 和高性能模式 (1.3GHz主頻) 下, 平衡模式下的等效理論峰值速度達每秒128萬億次定點運算, 高性能模式下的等效理論峰值速度更可達每秒166.4萬億次定點運算, 但典型板級功耗僅為80瓦, 峰值功耗不超過110瓦. 與寒武紀系列終端處理器一樣, MLU100雲端晶片仍然延續了寒武紀產品一貫出色的通用性, 可支援各類深度學習和經典機器學習演算法, 充分滿足視覺, 語音, 自然語言處理, 經典數據挖掘等領域複雜場景下 (如大數據量, 多任務, 多模態, 低延時, 高通量) 的雲端智能處理需求. MLU100的板卡使用PCIe介面, 其外形設計靈感來自於寒武紀地質時代的遠古海洋生物三葉蟲, 以黑色, 藍色為主色調, 簡潔而富有科技感.
寒武紀終端和雲端產品均原生支援寒武紀NeuWare軟體工具鏈, 可以方便地進行智能應用的開發, 遷移和調優. 陳天石表示, 寒武紀創立的初衷就是要讓全世界都能用上智能處理器. 寒武紀將秉承學術界開放, 協作的精神, 以處理器IP授權的形式與全世界同行共用寒武紀最新的技術成果, 使全球客戶能夠快速設計和生產具備人工智慧處理能力的晶片產品; 寒武紀在技術上貫徹 '端雲協作' 的理念, 這次發布的MLU100雲端晶片, 不僅可獨立完成各種複雜的雲端智能任務, 更可以與寒武紀1A/1H/1M系列終端處理器完美適配, 讓終端和雲端在統一的智能生態基礎上協同完成複雜的智能處理任務.
寒武紀生態爆發, 產業夥伴展示寒武紀晶片應用
在陳天石博士的主旨演講之後, 寒武紀的部分產業夥伴公開展示了基於寒武紀晶片的應用方案. 聯想集團於今日的發布會上推出了基於Cambricon MLU100智能處理卡的ThinkSystem SR650, 打破了37項伺服器基準測試的世界記錄. 該產品為2U2路機架式規格, 支援2個MLU100智能處理卡. 這款雲端智能伺服器的面世將全面支撐起聯想客戶在機器學習/VDI/虛擬化/雲/資料庫/分析/SAP等方向上的業務需求.
中科曙光也在今日的發布會上同步推出了基於Cambricon MLU100智能處理卡的伺服器產品系列 'PHANERON' . PHANERON系列於2017年11月面世, 基於寒武紀此前公布的一款原型測試晶片. 而此次發布的 'PHANERON' 新品跟隨MLU100智能加速卡的發布進行了同步升級, 性能更為強勁, 可以支援2-10塊寒武紀MLU處理卡, 靈活應對不同的智能應用負載. 以升級版的PHANERON-10為例, 單台伺服器可整合10片寒武紀人工智慧處理單元, 可以為人工智慧訓練應用提供832T半精度浮點運算能力, 為推理應用提供1.66P整數運算能力, 典型場景下的能效提升30倍以上. 此外, 中科曙光還披露了人工智慧管理平台SothisAI, 可以與寒武紀的晶片及其開發環境實現無縫對接, 深度融合.
智能語音應用的領頭羊科大訊飛公司也在今日的發布會上披露了與寒武紀晶片的深度合作研發項目. 根據介紹, 一小時的語音數據在一個傳統處理器上進行智能應用處理, 需要一萬小時才能完成, 因此科大訊飛一直在跟蹤人工智慧專用晶片的前沿進展. 早在2014年, 科大訊飛就開始與寒武紀的早期研究團隊開始溝通相關語音演算法在處理器上的實現, 並於2016年的天使輪注資寒武紀, 2017年開始在寒武紀晶片上進行應用測試. 科大訊飛於發布會上披露的測試結果表明, 寒武紀的智能處理器在語音智能處理上交出了優異的答卷, 能耗效率領先競爭對手的雲端GPU方案達5倍以上. 寒武紀智能處理器的強大處理能力使得手機本地端可以處理更加複雜的機器學習演算法, 使得語音本地識別準確率相對於傳統處理器領先了9.8%, 顯著提高了用戶體驗.