最全面麒麟970評價:從性能, 創新和產業貢獻來看一款好晶片

先談談怎麼才算評價一顆手機晶片的正確姿勢呢? 舉個栗子來講, 我們評價一個人一定是立體的, 我們評價一個人一定不會只看身高吧, 我們既要看他有什麼與眾不同, 也要看他有什麼缺點, 更要看他對自己對周邊的影響是什麼對吧. 那麼我們想正確 (劃重點) 評價一顆手機晶片也少不了橫比縱比, 哪兒好哪兒差, 以及對其行業發展的價值.

要完整全面地評價一款晶片必須能夠從三個層次來看:

第一層看技術表現, 產品對產品, 技術對技術地看, 把一顆晶片按照功能模組拆開看數據看錶現, 典型的比如用Geekbench測CPU性能, 用GFXBench測GPU性能, 用安兔兔測綜合性能, 進一步就是能夠利用自己設計的方式進一步解讀, 這一類的典型代表有Anandtech, 炮神, U君的評測, 其它我覺得暫時不必看了.

第二層看創新, 只有到達頂層的玩家才談得上會真的為創新做投入, 跟在屁股後頭跑的能跟上就不錯了.

第三層看產業, 看看產品對行業的影響力是什麼水平.

第一層: 麒麟970的技術表現

手機處理器從技術上來分總體也就是幾個模組: CPU, GPU, Modem, ISP, Audio, Video, 以後估計還會多一個NPU. 評價這些模組的技術水平我們行業內都用的是PPA (性能, 能效和面積) , 不過面積跟廣大消費者沒啥關係, 這次就不重點說了. 而以上幾個真正比較可比的是CPU和GPU, Modem比個規格差不多了, ISP是拍照的一部分, 也比較難比, Audio都偏軟了, Video也都差不多, NPU現在差不多隻有麒麟970有, 我們放後面再說.

CPU性能與能效

這張圖大家一看就明白了, CPU根本不是什麼麒麟驍龍之爭, 而是蘋果完爆安卓的局面. 四顆晶片全都是10nm工藝, 為什麼安卓三個都差不多, 而蘋果一枝獨秀呢? 其實也很簡單, 蘋果用了全自研架構, 而其它用的基本都是ARM標準架構. 此處預期會被噴, 說驍龍835明明用的是自研Kryo280架構啊! 是啊, 名義上是, 實際上呢?

我們把驍龍821, 驍龍835和用ARM A73的麒麟970三個晶片的Geekbench單核的單項得分放一起仔細看看 (上圖) , 有沒有看出驍龍兩代顯然不像一個媽生的, 相反驍龍830和麒麟倒是怎麼看怎麼像, 所以大家明白了沒有, 最合理的推測是高通實際上已經放棄了自有架構轉而回歸ARM標準核. 那麼為什麼回歸呢? 當然是因為驍龍821那一代的CPU做得實在失敗, 功耗大得實在感人, 不得已放棄掉了. 當然, 臉面還是很重要的, 這事兒直接講恐怕打臉, 所以應該是想盡辦法保留了繼續打自研Kryo旗號權利吧. 既然工藝都是10nm, 核也差不多都是ARM A73, 那麼驍龍835和麒麟970的CPU的PPA就不會有大的差異, 測不測都是這結果, 不是這結果的一定是測試方法上有問題, 具體不要來問, 請自查. 實際上對晶片能效的測試對外部的人來講實際上很難準確, 因為非常難清楚把各個模組的能耗數據摘出來, 而且由於對細節認知的不夠, 也經常會得出不準確的結論. 比如業界對硬體評測算最資深的Anandtech在測試CPU能效時用的那個CPUBurn的程序就有問題, 根本沒有考慮CPU的指令效率, 所以得出ARM A73比A72能效差很多的結論 (https://www.anandtech.com/show/11088/hisilicon-kirin-960-performance-and-power/4) , 如果是真的那ARM做CPU的人必須集體投江謝罪, 事實上他們還健在. 所以做評測是個嚴謹的活, 要用大腦想一想測出的結果合不合理, 不合理就該自己好好再看看方法, 或者索性把這個問題講出來, 不要輕易下結論.

所以我們給麒麟970的CPU做個小結論, 麒麟970的CPU與驍龍835, 獵戶座8895代表了安卓陣營最高水平, 但是跟蘋果A11比差距巨大. 這裡花很短篇幅說一下為什麼蘋果CPU性能這麼強, 其實也簡單, 蘋果等於把A73這種兩個大核合并起來變成它的大核, 單核性能自然差別很大, 但是其實代價也很大, 實際上蘋果A11的一個CPU核就差不多頂麒麟970兩個大核的面積, 用了兩個加起來那麼多的晶體管性能自然要好, 但功耗就不一定了, 所以在單核性能瘋狂提升的同時, 蘋果也開始配置小核了.

GPU性能與能效

一直以來, GPU實際上是網友一直都特別關心的, 因為打遊戲嘛. 其實比較有趣的是重3D遊戲人口在整個用戶群中其實比例一直很低, 也就是這一年多時間也不知怎麼的王者農藥就把大家搞high了, 即便這樣比例也不高, 但是因為這恐怕是用戶體驗直接映射到晶片的顯性體現, 所以各家晶片廠商都還是很重視的. 說到這裡我們簡單給手機GPU的幾大派歸個類:

蘋果是Imagination的PowerVR系列高通是自研的Adreno系列三星和華為用的ARM Mali系列行業裡基本看得到的也就這三家. 先說Imagination, 算移動GPU的開山鼻祖, 但基本就是被蘋果保養, 現在被蘋果甩了. 其實跟蘋果做生意也好也不好, 差不多就是喝毒藥, 因為蘋果把控力太強, 逐漸讓這些廠商的能力就局限起來, 讓你做什麼做什麼就行. 這就導致實際上對支援其它廠商用他家的GPU變得比較困難, 我們看看這兩年MTK抽風去用Imagination的GPU結果出來是什麼表現就明白了. 所以蘋果被餵飽了後自己開幹, 未來提升會比較顯著.

這兩年, 高通的Adreno可謂威震天下. 客觀的講, 高通的GPU確實好, 好到就靠它挽救高通渡過了驍龍810, 821這兩顆不怎麼成功產品的困難時期. 你要是問我好在哪兒, 對於這種系列性的好那隻可能是架構了, 高通的Adreno更好地適應了移動設備對圖形運算的訴求. 估計蘋果也是看到靠Imagination是沒戲了, 才決心自己乾的吧.

再來看看Mali, ARM這公司靠CPU發達了, 就想著擴展一下業務, 把周邊也做了吧. 其實一開始沒兩年Mali 400那一代表現是很不錯的, 有點兒小閃光的樣子呢, 可惜後來沒有持續下去, 被高通的Adreno甩開了一截. 三星和華為其實也沒什麼選擇, 只能上這條船, 那這個差距腫麼辦呢? 在半導體領域有個詞叫面積換功耗, 那就多放核唄, 就好比我一對一打不過你, 多叫幾個人, 每個人就都不用費很大勁, 也能把事兒辦了, 唯一的代價就是晶片成本變高, 但是蘋果, 三星, 華為都是自己給自己用, 所以自己承擔了, 消費者並沒什麼損失. 我們看一下這一代的性能比較, 半斤八兩, 已經被拉得平平的了.

但是, 雖然性能接近, 就代表體驗一樣嗎? 其實這個時候能效比這個問題就體現出來了, 能效比就是做同樣的事情消耗多少電, 在行業內會準確到焦耳/幀這樣的方式. 但是外界沒辦法去測, 而高通的GPU在這點上的優勢非常明顯, 而且越重載越明顯. 能效好就意味著發熱少, 發熱少就意味著晶片到達熱保護的時間越長, 觸發熱保護的時間越長就意味著降頻, 降頻就意味著卡頓. 實際上為了保證遊戲的幀率穩定, 各個手機廠家和遊戲廠家在策略上都會做一些考慮, 比如限制幀率在30fps-40fps, 這個時候GPU的工作負載不會很高, 發熱就比較少, 能夠保持, 但是當開啟60fps時連續跑就會明顯感覺發熱, 然後就會有不定期的卡頓, 所以對於重型的3D遊戲而言的表現是驍龍835﹥麒麟970﹥獵戶座8895.

剛剛提到, 能效比的優勢更主要體現在重載的情況下, 所以是跑benchmark的時候差距最大, 跑重型3D遊戲時次之, 而跑比例最多的中低負載遊時則, 這種情況下差距幅度會明顯縮小. 我一直想說的是我們做晶片的設計晶片時, 誰特麼會是以長時間跑滿設計的, 都是以跑在70%甚至更低的性能點而設計, 最高性能點從來都是為短時間峰值而設計, 測那個點有多大意義呢? 另外這方面其實很難測試測准, 因為只能取電池端的電流數據, 但是這個數據包含了整機全部的功耗, 要把其它部件準確排除掉是不大可能的. 如果大家實在感興趣也可以參考U君的遊戲測試, 雖然也不是那麼准, 但是還是可以看看的. 說到這兒想起個題外話, U君前一陣出了個麒麟970的評測, 結論是麒麟970能效相比驍龍835差距很大. 這一下有些人就像被捅到G點一樣那個興奮啊, 各種群好一通轉, 我看了就覺得好笑, 你想說明啥呢? 做好做壞都是人家老外的事兒, 圈裏海思展訊的人家還好歹還能自己做點兒主呢, 你這在產品上插不上話的有啥好興奮的.

GPU其實還沒說完, 上面講的是繪圖能力, 實際上GPU的數據並行特性還可以做更多的事情, 各家GPU除了繪圖, 都設計了對Computing的支援, 體現在基於OpenCL標準的應用場景上, 實際上很多界面效果都是用OpenCL (行業標準) 或者RenderScript (Google) 來實現了, 而後續基於GPU的神經網路運算也會基於OpenCL來做. 這部分的性能因為不那麼顯性所以外行並不很關注, 但是這是GPU不可缺少的部分能力, 實際上安兔兔和Geekbench都有測試, 以Geekbench為例大家看看麒麟970性能是什麼水平. 大家可以看到GPU Computing的性能水平是: 獵戶座8895≈麒麟970﹥驍龍835. 由此可見, 高通的Adreno GPU在設計上是偏向繪圖的, 而Mali則考慮Computing會更多一些.

寫到這總結一下麒麟970的GPU, 繪圖理論性能追平了驍龍835和獵戶座8895, 但能效的差距還是明顯. 回顧一下麒麟950, 960到現在970的情況, 看得出海思改善GPU性能和能效比的決心還是很大的. (下圖)

第二層: 麒麟970的技術創新

麒麟970這一代在AI上的創新恐怕大家都看到了, 這一次和蘋果並肩站在了行業最前列. 實際上創新的不是AI本身, 而是加了個NPU進去. 不要小看這個硬體, 晶片設計中對加入一個獨立新模組素來是很謹慎的, 因為首先晶片那可真是寸土寸金, 每增加一塊面積都是成本, 如果增加的這一塊兒成本是兩毛美金 ($0.2) , 按照出貨5000萬來算那就是1000萬美金的利潤啊. 第二新的硬體需要融合進真箇系統, 對系統整個軟體架構是有很大的工作量的, 這也都是成本. 所以晶片公司會在這方面非常謹慎, 只有確信能被廣泛用起來才會加入. 那麼為什麼蘋果和華為這樣做了而高通卻沒有呢? 其實很簡單, 原因是高通是賣晶片的, 它怎麼確信自己客戶能用起AI來呢, 萬一用不起來這個成本不就白加了. 而蘋果和華為是自己給自己用的, 當然知道加的NPU能不能用起來, 當然能夠更容易的下這種創新的決定. 所以未來, 大家等著瞧, 同樣的原因, 蘋果, 華為和三星這BIG3肯定會在創新上更激進, 而高通會相對保守.

回過來我們看看麒麟970在AI領域的創新是什麼概念, 什麼程度, 有什麼價值.

現在AI領域的基本方法並不是什麼新鮮東西, 二三十年前就有了, 問題一直被計算性能限制著. 你想啊, 你一個演算法要跑好幾天還有P用. 這個問題首先在學習側被高速發展的英偉達用幾年時間很大程度的緩解了, 穀歌做了TPU2出來也很大程度降低了學習側的門檻. 這樣好了, 一定會湧出大量AI的演算法和模型出來, 大家做這些不就是為了用嗎? 但是拿到了手機上跑不動是不是想死. 事實上確實手機的AI inference性能成為AI應用普及的最大瓶頸. 所以蘋果和華為就加了NPU啊, 我有些不理解這麼明顯的趨勢高通怎麼會這麼保守, 你可是當年業界老大啊, 現在怎麼保守成這樣.

那麼麒麟970的AI性能相比蘋果的A11是怎樣呢? 根據它發布會公布的數據來看, 下面這張最有參考價值, 因為表明了是在哪些網路下對比的, 整體看是明顯高於蘋果A11的. 不過根據蘋果的資料, 目前它的Neural Engine只用於內置Face ID應用, 並沒有開放給開發者, Core ML只能訪問到基於GPU的神經網路加速. 所以以此判斷對於AI應用的開發者而言, 無論能效還是性能肯定還是麒麟970更好. 從這點看海思還是很牛逼的.

有人會說驍龍835雖然沒有硬體單元, 但是有DSP或者GPU, 也不能算沒有AI能力. 我想說的是這就是典型的保守, 覺得不加成本就可以勉強支援挺好. 用這個DSP或者GPU來跑肯定幹不過硬體邏輯啊, 更何況這些都是共用資源, 你一個應用在跑的時候, 能分給AI多少呢?

好, 總結一下創新層面, 顯然麒麟970這次向前跨了一大步, 成為了手機AI晶片事實的領導者, 這一點甩出驍龍835和獵戶座8895好幾條街.

第三層: 麒麟970對產業的貢獻

實際上我們可以對每一代麒麟晶片有個一句話的評價:

麒麟950: 第一個躋身頂級手機SoC處理器行列的麒麟晶片麒麟960: 水桶芯麒麟970: 業界第一個真正意義上的手機AI處理器大家可以從上面這幾句話感受一下麒麟970的行業意義, 我從幾個維度進一步為大家擼擼:

1, 在Android還沒有明確想法的情況下, 海思大膽地做出了這個創新, 並且還為之開發了一整套開發套件, 這是個很有思想的動作, 也是安卓領域第一個敢於跨出這第一步的玩家

2, 幫助寒武紀從一個實驗室成果變成了產品化的東西, 對整個中國的AI晶片領域帶出了一大批有經驗的人才和成果

3, 解鎖一批長期因為受限於手機AI性能而無法落地的應用開發者, 可以預期會帶動一波AI應用出現在用戶面前, 並且這一波開發者和體驗會首先出現在中國

4, 實質性加速了整個手機晶片圈對AI的判斷, 更多的投資會進入, 更多的業務會被挖掘出來

以上這些從我們從業者角度來看可以說有非常非常重大的意義, 而且海思素來是中國半導體領域的黃埔軍校, 親愛的米粉們, 你們寄予厚望的松果不也是海思出來的人在擔綱嗎?

如果讓我為麒麟970寫一段評語, 我會這麼寫: 麒麟970是華為的一次勇敢嘗試, 嘗試卓爾不群, 嘗試跨出領先的這一步. 手機晶片產業會記住它, AI產業也會記住它. 更重要的是它不是別人做出來的, 而就是你我身邊的普通人做出來的, 這深深鼓舞了我們!

附1: 麒麟970行業水平整體對比一覽 (1-5分制)

附2: 本文主要參考數據來源

Geekbench: https://browser.geekbench.com/v4/cpu/singlecore

GFXBench: https://gfxbench.com/result.jsp

原文轉自知乎專欄作者: whoknows

2016 GoodChinaBrand | ICP: 12011751 | China Exports