機情觀察室: 麒麟980性能深度解析

在中國龐大的手機市場中, 能造手機的品牌很多, 但能做處理器的確鳳毛麟角, 在高端市場, 更是只有華為海思的麒麟處理器一家. 華為作為國產唯一自研的海思麒麟處理器, 一直以來備受關注, 經過幾年的積累, 已經在高端移動處理器市場站穩腳跟.

與蘋果一樣, 華為的麒麟晶片目前也只應用在自家的產品中, 這對於打造華為自家移動終端的差異化, 與終端緊密結合的優勢, 更方便華為手機能夠針對用戶實際的需求靈活的改進. 當然, 這樣的產品策略也使得華為對於每一代麒麟晶片必須謹慎, 因為如果麒麟晶片與最初設想不符, 則會導致一整年的旗艦產品受到巨大的影響. 因此, 每年的麒麟旗艦晶片, 都是我們關注的焦點. 今天我們就來看看華為最新的麒麟980, 究竟如何?

全新的Cortex-A76

麒麟980在規格上最大的亮點就是採用7nm工藝, 整合了69億個晶體管. 據TSMC的官方統計, 相比上一代旗艦——10nm工藝製程的麒麟970, 980性能提升約20%, 能效提升約40%, 邏輯電路密度提升60%, 即原來的1.6倍. 眾所周知, 傳統晶片遵循摩爾定律, 以提升單位面積內晶體管的數量, 來提升晶片的性能. 我們已經知道, 決定一款處理器性能最核心的因素主要是工藝, 架構等方面. 而工藝越先進, 則意味這處理器的精細度越高, 可以整合更多的晶體管. 更重要的是, 更精細的製造工藝, 還能夠儘可能的縮小元器件之間的距離, 減小功耗. 尤其是對於現在智能手機的架構, 越來越 '暴力' 的架構對工藝更加依賴. 而目前晶片製造工藝普遍停留在10nm, 7nm工藝則一度被稱為' 最逼近矽基半導體工藝的物理極限' , 因此, 這次麒麟980首發的7nm工藝則體現了麒麟在工藝上的進步.

有趣的是, 我們都知道, ARM主要有三個產品設計團隊: 歐洲的設計團隊, 德克薩斯奧斯丁團隊以及劍橋團隊. 從產品線來看, Cortex-A57, A72架構出自於ARM在美國德州的奧斯汀團隊, 而A53, A73則是ARM在歐洲的團隊所設計, 而A55這樣的小核則是來自英國劍橋大本營. 這也可以看出不同的設計團隊的不同風格, 比如德州人天性粗獷的性格, 歐洲人的文藝氣息, 以及英國人慢條斯理的紳士風. 而A76則是來自德州的奧斯汀團隊. 由此也可以看出A76的基本性格: 還是朝著A57, A72這樣偏重性能的方向.

在CPU方面, 麒麟980基於ARM Cortex-A76 CPU架構. 在移動SoC領域, 目前諸如驍龍845, 蘋果A12 Fusion這樣的旗艦晶片都已經採用自研微架構, 而麒麟則一直沿用ARM公版架構. 華為表示術業有專攻, 自研架構對於麒麟目前並非是最好的結果, 更何況決定CPU的指令集與架構都是ARM發明的, 因此如果沒有大幅度的提升, 自研與採用公版架構並沒有太大區別. 相比於競品, 麒麟更追求在綜合性能的提升.

性能方面, 根據ARM官方的說法, Cortex A76在最新7nm工藝下, 運行頻率能將達到3GHz, 相比上一代麒麟970所用的A73, 整數性能提升了90%, 浮點性能提升了150%, 綜合性能提升80%. 儘管這樣的對比並非在同工藝同頻的狀態下對比, 並不能完全體現新架構的性能. 因此我們還要看應用到晶片當中的實際數據. 在麒麟980的發布會上, 華為官方給出的數據則稱, 相比於上代麒麟970提升75%, 而能耗上則提升58%. 這也是考慮到麒麟980的最高主頻為2.6GHz, 所帶來功耗與發熱之間的平衡. 對比ARM官方的參考數據, 倒也比較靠譜.

這套全新設計的A76 CPU架構, 由2個超大核, 2個大核和4個小核的三檔能效架構組成, 採用DynamIQ調度技術. 相比於Big.little, DyanmIQ重新定義了多核微架構, 而DynamIQ最大的特點就在於DynamIQ 叢集的一個叢集中Cortex-A CPU數量可以從單核到8核不等, 並且還支援異構CPU之間的混搭. 因此, 此次麒麟980在調度方面, 針對於不同的使用場景, 能夠把不同核心之間進行靈活調度, 執行效率更高.

另外, 在架構方面, A76相比於自家團隊所做的上一代的A72, 從順序三發射增加為亂序四發射, 而且在流水線方面A72的15級核心流水線精簡至13級流水線. 帶來更高的執行效率. 我們知道, 一般來說, 亂序發射需要更多的寄存器, 流水線一般也更深, 因此功耗也會更大. 但得益於工藝的進步, 使得功耗的下降能夠讓設計者帶來更大規模的架構.

低調的Cortex-A55

在能效核心方面, 麒麟980選擇了A55. 提到A55, 就不得不提它的前輩A53, 這個12年發布的大名鼎鼎的架構直到現在還在統治著中低端處理器. 出色的能耗比以及強大的擴展性, 使得A53幾乎被應用在絕大多數的中低端處理器上. 而A55, 則是A53的提升版.

Cortex-A55採用最新的ARMv8.2架構, 根據ARM官方給出的數據, 在相同的頻率與工藝條件下, 記憶體性能最高可達Cortex-A53的兩倍, 而在相同的頻率與工藝條件下, 效能比Cortex-A53高15%. 值得一提的是, ARM為A55設計了一個二級快取記憶體, 對於每一個核心都是專用記憶體, 與 Cortex-A53 相比, 二級快取記憶體的存取時間縮短了 50% 以上. 而且二級快取記憶體的工作頻率設計成與 CPU 相同的頻率. 通過降低延遲大幅提升 CPU 在各類基準測試工具中的性能.

另外, ARM對A55還推出了三級快取記憶體, 可供集群內的所有 Cortex-A55 CPU 共用. 尤其是對於DynamIQ集群之下的核心, 能夠得益於 CPU 附近增多的記憶體容量, 從而提升性能, 降低系統功率. 相比A53, 在同等性能的情況下, Cortex-A55能夠節省的功耗比A53提升了30%. 這對於中低端處理器是非常重要的.

全新的G76, 能帶領麒麟翻身嗎

麒麟980採用Mali-G76 MP10, 主頻為720MHz, 相比於上一代, Mali-G76的提高單位功耗性能和單位面積性能, 性能密度相較於前代Mali-G72提高了30%, 架構效率提升了30%, 機器學習處理能力提高了2.7倍. 事實上, 相比於高通的Adreno的面前, Mali在單核心性能上一直都是弟弟. 因此Mali系列在推出時, 你經常可以看到什麼MP20, MP32之類 '很嚇人' 的數字. 但問題是作為一個體積基本固定的手機, 是不可能無限堆疊核心, 因此Mali在Adreno面前一直都略顯孱弱.

觀其曆史, 通過參數對比我們可以看到, 採用Mali的兩家, 三星採用的策略是低頻多核心的方案, 例如Exynos 9810, 堆了18顆核心, 但主頻只有546MHz, 而麒麟則是高頻低核的策略, 之前的麒麟970 MP12主頻為746MHz. 因此在G76中, ARM將Mali最大的可採用核心降到20個, 以提升能量密度. 這也是比較符合目前整個移動SoC的大趨勢.

Mali G76採用最新基於Bifrost的架構, 與之前midgrad架構相比, Bifrost最大的創新在於使用指令組著色器(ClausedShader), 另外Bifrost架構還採用Quad based vectorization技術, 相比於之前SIMD向量化技術一次只能執行單一線程, Quad向量化技術最高支援四線程執行, 共用控制邏輯, 使用率接近100%. 相比於G72, G76性能密度提升了30%, 能效提高20%.

在功耗方面, 我們引用anandtech採用GFXBench Manhattan 3.1離屏的能效數據, 可以看到, 在7nm工藝下, G76 MP12的平均功率表現不錯, 只有4.08W, 甚至比S9+的5.01W還低一些, 而相比於上一代的麒麟970的6.33W有了很大的提升. 而在效率上, 更是進步非常明顯(注意, 這裡指的是能耗, 而非絕對性能). 因此, 能耗的進步將使麒麟980成為麒麟950之後的又一代經典.

跑分測試:

首先是Geekbench, 經過我們的三次測試(取平均數), 單核成績為3308分, 多核成績9752分. 主要得益於A76架構和7nm工藝的提升, 麒麟980對比驍龍845也有比較明顯的提升;

而在考驗CPU計算能力與穩定性的圓周率的測試中, 麒麟980也給了我們一個意外的驚喜, 表現非常不錯. 平均每項測試都比845略微領先.

GFXBench測試, 麒麟980的Mali-G76在Adreno面前確實還是有差距, 儘管相比前代差距已經在縮小. 但確實, 在GPU方面, Adreno還是領先於Mali.

而在3DMark的測試中, OpenGL ES 3.1為3524, Vulkan為4018. 在Vulkan下, 可以看到Mali的性能明顯比OpenGL ES 3.1的更高, 甚至幾乎追平了GPU方面的差距. 這也得益於麒麟近幾年在Vulkan的優化. 目前比較流行的《王者榮耀》等遊戲已經逐漸在從OpenGL向Vulkan轉換, 而Vulkan就是安卓大型遊戲的未來.

其它方面:

在ISP方面, 麒麟980採用第四代自研ISP, 像素吞吐率比上一代提升46%, 能效提升23%, 而且能夠分區域調節映像色彩與灰階, 支援更多攝像頭, 還具備HDR色彩還原能力, 能夠分區域調節映像色彩, 實現照片色彩與細節的平衡.

這也帶來Mate 20系列強大的夜拍功能. 麒麟980針對暗光場景, 晶片採用全新Multi-pass多重降噪技術, 可精準降低夜景照片中的噪點, 保留更加完整的細節, 夜拍效果更佳通透清晰. 配合麒麟980的雙核NPU, 可實現每分鐘識別4500張影像, 識別速度相比上一代提升120%. 而在官方視頻中, 麒麟980還能即時繪製出人體的關節和線條, 可以準確識別多種物體, 實現了從映像識別到物體檢測的跨越.

而在最重要的基帶方面, 麒麟980在全球率先支援LTE Cat.21, 支援業界最快的下行1.4Gbps速率, 更靈活應對全球不同運營商的頻段組合. 並且值得一提的是, 華為已經為麒麟準備好Balong 5000 Modem, 為5G Solution Ready.

總結:

自麒麟950以來, 麒麟處理器逐漸站在了高端處理器的行列. 儘管並非完美, 但可以明顯的感受到, 這幾年麒麟一步一個腳印的在進步, 不斷改進. 直到在這一代, 麒麟980無論是一些關鍵的核心指標, 還是其它的散髮型功能, 麒麟980已經沒有明顯的短板, 並且在均衡的基礎上, 能夠發揮自己與終端緊密結合的優勢, 針對用戶實際的需求進一步改進, 應用在移動終端. 這才是對於華為, 對於麒麟最重要的戰略意義.

2016 GoodChinaBrand | ICP: 12011751 | China Exports