'AI晶片' | 還處於草莽時代, 狂奔中 | '泡沫' | 待擠

人工智慧正在改變各行各業, 而晶片是實現人工智慧的載體.

2018年, 資本對半導體晶片的熱情被AI技術徹底點燃, 不管是巨頭公司還是創業公司, 傳統製造公司還是互聯網公司, 都對晶片熱情高漲. 5月到7月, 雲知聲, 出門問問, Rokid, 百度紛紛發布AI晶片或晶片模組, 思必馳確認正在打造AI語音晶片,深鑒科技對外宣布其AI晶片將於今年下半年面市, 雲知聲創始人兼CEO黃偉甚至用 '不做晶片, 必死' 來表達自己做AI晶片的決心.

然而, '到現在為止, 全球還沒有出現一款真正的AI晶片, 因為真正的人工智慧還遠未能實現. ' 異構智能中國區總經理周斌的這番話代表了部分業內人士的觀點.

《IT時報》記者採訪大量AI界人士後發現, 對於AI晶片的概念, 目前全球並沒有形成統一共識, 甚至有投資人認為, AI晶片領域存在泡沫, 大部分創業公司將會消失.

但無論如何, 身在草莽年代的AI晶片群雄們, 總會有人為中國核心技術國產化 '殺出一條血路' .

AI 晶片的不同定義

'初創企業做AI晶片很可能得不償失. ' 晶片企業蘇州邁瑞微公司的創始人李揚淵在行業裡浸淫十幾年, 他告訴《IT時報》記者, 一款晶片從0到1需要10年以上的周期, 他自家的晶片產品也是流片5次後才正式商用, 流片20次才能處於業內頂尖的位置, '如果是企業自行研發AI晶片, 採用40nm (納米) 工藝, 那麼成本可能會上漲而不是降低. 晶片必須靠規模分攤研發成本, 40nm工藝僅流片費高達1000萬元, 分攤給100萬PCS (某一產品單位數量) , 平均每片成本高達10元, 這還不包括更加高額的研發費用. '

但Rokid平台研發負責人朱斌的觀點恰恰與李揚淵相反, '智能設備採用通用晶片是殺雞用牛刀, 特殊需求需要特殊晶片來解決痛點, 定製AI晶片恰恰是在降低成本, 人工智慧硬體對算力有需求, 低端的通用晶片算力不夠, 高端的通用晶片又有許多冗餘設計, 造成高功耗. '

AI晶片也被稱為AI加速器或計算卡, 通常概念中, AI晶片是指專門用於處理人工智慧應用中的大量計算任務的模組 (其他非計算任務仍由CPU負責) , 當前主要分為GPU, FPGA, ASIC等類型, 與高通驍龍等通用晶片不同, AI晶片主要用於處理專用任務, 比如安防中高清視頻的識別, 自動駕駛時的數據計算等等.

6月26日, Rokid發布了一款KAMINO18 自研AI語音專用晶片, 可支援智能音箱和兒童故事機, 不同於英特爾, 高通等傳統通用晶片, 這是一塊AI語音專用的SoC (系統級晶片) 晶片, 其內部繼承了ARM, NPU, DSP, DDR, DAC等多個核心元件, 大小與一枚一元硬幣差不多. 朱斌曾經專門對語音喚醒做硬體上的架構設計, 發現通用晶片中許多功能用不到, 但附件成本依然存在, 於是, Rokid在去年9月開始定製自己的晶片, 採用DSA (Domain specific architecture) 架構, 從本身的產品和演算法要求出發, 用異構計算的方式整合到晶片中, 在整機工作狀態下, 產品功耗能降低30%到50%.

李揚淵和朱斌的不同觀點, 恰好代表了傳統半導體行業與互聯網創業公司對AI晶片的兩種不同認知, 半導體圈出身的人更看重晶片從0到1的突破, 而 '由軟變硬' 的互聯網創業者卻更希望在1, 2, 3, 4的基礎上, 通過演算法和軟體設計, 直接變成10. 從目前已發布的AI晶片來看, 它們主要目的體現在以合適的形態和功耗來加速某種機器學習演算法上. 比如, 用在邊緣側和終端側設備時, 要求極低的功耗和極高的矩陣/浮點運算能力, 這些是通用型晶片很難做到的.

可佐證的是另一家龍頭晶片廠商的工程師對此的解釋, 在他看來, 目前市場上大多數AI語音晶片, 屬於一種服務於 '專有' 功能的晶片 (可類比DSP數據訊號處理) , 由於專註於一項或幾項功能, 限定於特定場景使用, 所以設計和生產的複雜度要比通用晶片低, 加上這類晶片很少牽扯技術授權的原因, 做起來會更加容易. 這些AI晶片並不是從底層開始做起, 而是直接從SoC或者通用處理器外掛某種 '協處理器' 之類架構優化, 通過各種IP的組合來加速上層應用的場景, 譬如語言, 映像.

異構的殊途同歸

目前, AI晶片並無清晰的定義, 所以如何算 '真正' 並不好衡量. 不久前的2018動點國際峰會 (杭州) 上, 矽谷創業公司異構智能中國區總經理周斌試著給AI晶片下了個定義, '能夠高效率, 高性能地完成目前人工智慧最核心的演算法, 由於現在主流演算法是深度學習, 意味著AI晶片必須對深度學習有非常好的支援. ' 從數據來看, 周斌認為, AI晶片的計算能力必須要超過每秒5萬億次, 因為只有達到這樣的性能指標, 很多特定應用計算結果才可能與人的能力相媲美.

周斌公司的名字—— '異構' , 實質上正是對AI晶片創業者們互聯網背景最直接的闡釋. 異構, 顧名思義是指由不同來源共同構成, 互聯網就是一個典型的異構網路. 後來演化出的異構計算, 是一種特殊形式的並行和分布式計算, 常被用於協調不同硬體以滿足不同的計算需求, 並使代碼 (或代碼段) 能以獲取最大總體性能方式來執行.

目前AI晶片基本都通過多種晶片進行異構計算. 過去傳統晶片公司只專註於少數幾種晶片, 但現在的晶片公司開始注重橫向發展, 整合不同類型的晶片, 比如, 手機SoC在傳統的CPU (中央處理器) , GPU (圖形處理器) , ISP (線上編程) 之外, 還會加入另外用來加速AI的NPU (嵌入式神經網路處理器) 等處理核心. '異構晶片中有一部分是通用功能. ' 雲知聲聯合創始人康恒告訴《IT時報》記者.

成本決定的道路

一個有趣的現象是, 互聯網出身的AI創業者都在跑步進入AI晶片硬體領域, 而傳統晶片廠商卻在用演算法等 '軟' 的方法實現AI.

AI技術有三大要素, 演算法, 算力和數據. 從國際AI技術前沿來看, 深度學習等演算法模型的研發並未成熟, 遷移學習, 膠囊網路等新的演算法模型都在同步快速發展, AI晶片該使用什麼方法和原理實現仍在探索階段. 事實上, 目前主流晶片廠商並沒有推出AI晶片, 很多AI功能都通過通用晶片加特殊的演算法, 軟體完成.

高通今年年初推出的人工智慧引擎 (AI Engine) 包括軟硬體兩部分, 在高通驍龍核心硬體架構 (CPU, GPU, VPS向量處理器) 上搭載了神經處理引擎 (Neural Processing Engine, NPE) , Android NN API, Hexagon神經網路庫等軟體, 讓人工智慧在終端側 (如智能手機) 上的應用更快速, 高效. 高通旗下晶片產品驍龍845, 驍龍835, 驍龍820, 驍龍660都支援AI Engine, 而國內不少打著AI旗號的手機也基本採用高通方案, 通過該AI Engine更好實現人臉識別功能.

但對於目前AI晶片的創業者和智能家居廠商而言, 通用晶片 '太貴' 了.

康恒告訴《IT時報》記者, 電視, 空調等大家電產品的利潤足以覆蓋語音模組的高成本, 但風扇, 電燈等小家電成本限制較大, 模組的優勢便削弱了, '客戶想做更多的智能品類, 下沉到低端產品, 但市場上根本找不到合適的晶片, 一款百元以內的產品, 通用晶片並不划算. ' 打造自己的AI晶片後, 雲知聲可以把語音AI技術的晶片方案開放給客戶, 在成本及供應周期上有了更大的主動權.

但是李揚淵認為人工智慧的關鍵技術, 在不同階段的重要程度不同. '處理器不是人工智慧關鍵技術, 專用處理器只在部分工作段起提升競爭力的作用. ' 他認為感知段以感測器為中心, 處理器存在價值並不高; 認知段, 學習段和決策段, 太強調處理器反而影響成本, 包括一次性成本和功耗成本.

'沒有哪一段以專用的人工智慧晶片為前提, 應該把研發人工智慧晶片當作一件獨立的事, 而不是軟體研究的自然延伸. ' 李揚淵以人做比喻, 感測器是人的軀殼, 大腦靠演算法取勝.

半導體分析師李壽鵬也認為, 人工智慧依靠的是演算法, 晶片只是載體. 如果想用ASIC (全定製晶片) 去做更好的語音識別處理, 硬體差異性並不大. 對語音識別來說, 識別語句與軟體, 網路, 訓練更有關係, 而之前存在的雲和端數據交換延遲問題, 也會隨著5G到來, 迎刃而解.

落地第一站: 智能音響

研發AI晶片比高端通用晶片更簡單, 是AI圈普遍的認知.

雲知聲聯合創始人, IoT事業部副總裁李霄寒認為, 經過幾十年的發展, 晶片業沉澱了很多模組化的東西, 比如高通和聯發科都是基於ARM的架構設計晶片, 因此, 並不是每一款AI晶片都要從零開始, 可以用業界成熟的模組和產品, 但AI晶片的核心加速模組需要從最底層開始設計. 從 2014 年提出雲, 端, 芯戰略, 到 2015 年正式建立研發團隊, 再到 2018 年推出AI 晶片 '雨燕' , 雲知聲花了整整 4 年時間, 漸漸意識到AI不能只在雲端, 要落地.

2018年被稱為AI晶片落地年, 所謂落地, 是指AI晶片要搭載到終端上商用. 2017年, 中國在晶片領域的投資超過1500億元人民幣, 2018年開始, 這些投資的產業將陸續密集落地. 信中利資本集團創始人, 董事長汪潮湧不久前在尋找中國創客第四季夏季峰會上指出, 中國每年花費3000多億美元進口各類晶片, 消耗全球1/3的晶片, 自給率不到10%, 因此, AI晶片的投資是重中之重, 但由於安防AI晶片的流片成本和研發費用高昂, 目前尚未形成規模化的出貨量來抵扣成本;自動駕駛汽車未量產, 自動駕駛AI晶片安全性未達要求;其他特定領域AI晶片總體下遊需求不足, 供大於求, '目前AI領域存在較大泡沫. '

根據摩爾定律, 晶片每隔18個月性能就會提升一倍, 成本會下降一半, 但半導體行業賺錢的根本秘訣還是規模化, 能否有足夠大的出貨量和商用市場, 是AI晶片順利從紙面上 '著陸' 的關鍵. 此前有媒體報道, 即便是安防領域的 '大佬' 海康威視, 每年對於英偉達的需求也只有20萬片.

從這個角度來看, 智能音響可能是AI晶片最早實現落地的市場. 調研公司Canalys Research (以下簡稱Canalys) 發布報告稱, 到今年年底, 智能音響的保有量將達到1億部, 幾乎是去年的2.5倍. 去年, 智能音響的保有量不足5000萬部. 未來幾年, 智能音響的保有量將繼續增長, 到2020年其保有量將增加一倍以上, 達到2.25億部.

雲知聲今年5月發布了面向物聯網的AI晶片UniOne, 用於在終端本地做邊緣計算, 可以為智能音響, 智能家居, 智能家電等提供服務方案. 出門問問發布的AI語音晶片模組 '問芯' 已經量產, 客戶可以下單購買.

出門問問的CEO李志飛認為, 晶片是一個長周期產業, 從概念開始, 要經過系統設計, 模組設計, 模擬驗證, 線路綜合, 布局布線, 流片生產, 封裝測試, 驅動開發, 解決方案適配等非常長的流程, 晶片一旦做成很難像軟體一樣再做修改, 必須重新設計流片, 迭代周期長, 成本高, 而晶片本身屬性是一種計算的硬體載體, 不同的晶片適配不同的演算法和應用場景, AI晶片一方面要有足夠的算力去運行各種語音AI演算法, 另一方面還要針對各種場景做大量介面的適配, 同時讓成本和功耗滿足大規模量產的商業要求.

'能產業化且能在市場上對國外的同類產品構成競爭威脅才是一塊晶片成功的標準. ' 一位業內人士如是說道. 從這一點來看, 中國的AI晶片才剛剛起步, 江湖草莽, 泡沫待破.

2016 GoodChinaBrand | ICP: 12011751 | China Exports