机情观察室: 麒麟980性能深度解析

在中国庞大的手机市场中, 能造手机的品牌很多, 但能做处理器的确凤毛麟角, 在高端市场, 更是只有华为海思的麒麟处理器一家. 华为作为国产唯一自研的海思麒麟处理器, 一直以来备受关注, 经过几年的积累, 已经在高端移动处理器市场站稳脚跟.

与苹果一样, 华为的麒麟芯片目前也只应用在自家的产品中, 这对于打造华为自家移动终端的差异化, 与终端紧密结合的优势, 更方便华为手机能够针对用户实际的需求灵活的改进. 当然, 这样的产品策略也使得华为对于每一代麒麟芯片必须谨慎, 因为如果麒麟芯片与最初设想不符, 则会导致一整年的旗舰产品受到巨大的影响. 因此, 每年的麒麟旗舰芯片, 都是我们关注的焦点. 今天我们就来看看华为最新的麒麟980, 究竟如何?

全新的Cortex-A76

麒麟980在规格上最大的亮点就是采用7nm工艺, 集成了69亿个晶体管. 据TSMC的官方统计, 相比上一代旗舰——10nm工艺制程的麒麟970, 980性能提升约20%, 能效提升约40%, 逻辑电路密度提升60%, 即原来的1.6倍. 众所周知, 传统芯片遵循摩尔定律, 以提升单位面积内晶体管的数量, 来提升芯片的性能. 我们已经知道, 决定一款处理器性能最核心的因素主要是工艺, 架构等方面. 而工艺越先进, 则意味这处理器的精细度越高, 可以集成更多的晶体管. 更重要的是, 更精细的制造工艺, 还能够尽可能的缩小元器件之间的距离, 减小功耗. 尤其是对于现在智能手机的架构, 越来越 '暴力' 的架构对工艺更加依赖. 而目前芯片制造工艺普遍停留在10nm, 7nm工艺则一度被称为' 最逼近硅基半导体工艺的物理极限' , 因此, 这次麒麟980首发的7nm工艺则体现了麒麟在工艺上的进步.

有趣的是, 我们都知道, ARM主要有三个产品设计团队: 欧洲的设计团队, 德克萨斯奥斯丁团队以及剑桥团队. 从产品线来看, Cortex-A57, A72架构出自于ARM在美国德州的奥斯汀团队, 而A53, A73则是ARM在欧洲的团队所设计, 而A55这样的小核则是来自英国剑桥大本营. 这也可以看出不同的设计团队的不同风格, 比如德州人天性粗犷的性格, 欧洲人的文艺气息, 以及英国人慢条斯理的绅士风. 而A76则是来自德州的奥斯汀团队. 由此也可以看出A76的基本性格: 还是朝着A57, A72这样偏重性能的方向.

在CPU方面, 麒麟980基于ARM Cortex-A76 CPU架构. 在移动SoC领域, 目前诸如骁龙845, 苹果A12 Fusion这样的旗舰芯片都已经采用自研微架构, 而麒麟则一直沿用ARM公版架构. 华为表示术业有专攻, 自研架构对于麒麟目前并非是最好的结果, 更何况决定CPU的指令集与架构都是ARM发明的, 因此如果没有大幅度的提升, 自研与采用公版架构并没有太大区别. 相比于竞品, 麒麟更追求在综合性能的提升.

性能方面, 根据ARM官方的说法, Cortex A76在最新7nm工艺下, 运行频率能将达到3GHz, 相比上一代麒麟970所用的A73, 整数性能提升了90%, 浮点性能提升了150%, 综合性能提升80%. 尽管这样的对比并非在同工艺同频的状态下对比, 并不能完全体现新架构的性能. 因此我们还要看应用到芯片当中的实际数据. 在麒麟980的发布会上, 华为官方给出的数据则称, 相比于上代麒麟970提升75%, 而能耗上则提升58%. 这也是考虑到麒麟980的最高主频为2.6GHz, 所带来功耗与发热之间的平衡. 对比ARM官方的参考数据, 倒也比较靠谱.

这套全新设计的A76 CPU架构, 由2个超大核, 2个大核和4个小核的三档能效架构组成, 采用DynamIQ调度技术. 相比于Big.little, DyanmIQ重新定义了多核微架构, 而DynamIQ最大的特点就在于DynamIQ 丛集的一个丛集中Cortex-A CPU数量可以从单核到8核不等, 并且还支持异构CPU之间的混搭. 因此, 此次麒麟980在调度方面, 针对于不同的使用场景, 能够把不同核心之间进行灵活调度, 执行效率更高.

另外, 在架构方面, A76相比于自家团队所做的上一代的A72, 从顺序三发射增加为乱序四发射, 而且在流水线方面A72的15级核心流水线精简至13级流水线. 带来更高的执行效率. 我们知道, 一般来说, 乱序发射需要更多的寄存器, 流水线一般也更深, 因此功耗也会更大. 但得益于工艺的进步, 使得功耗的下降能够让设计者带来更大规模的架构.

低调的Cortex-A55

在能效核心方面, 麒麟980选择了A55. 提到A55, 就不得不提它的前辈A53, 这个12年发布的大名鼎鼎的架构直到现在还在统治着中低端处理器. 出色的能耗比以及强大的扩展性, 使得A53几乎被应用在绝大多数的中低端处理器上. 而A55, 则是A53的提升版.

Cortex-A55采用最新的ARMv8.2架构, 根据ARM官方给出的数据, 在相同的频率与工艺条件下, 内存性能最高可达Cortex-A53的两倍, 而在相同的频率与工艺条件下, 效能比Cortex-A53高15%. 值得一提的是, ARM为A55设计了一个二级高速缓存, 对于每一个核心都是专用内存, 与 Cortex-A53 相比, 二级高速缓存的存取时间缩短了 50% 以上. 而且二级高速缓存的工作频率设计成与 CPU 相同的频率. 通过降低延迟大幅提升 CPU 在各类基准测试工具中的性能.

另外, ARM对A55还推出了三级高速缓存, 可供集群内的所有 Cortex-A55 CPU 共享. 尤其是对于DynamIQ集群之下的核心, 能够得益于 CPU 附近增多的内存容量, 从而提升性能, 降低系统功率. 相比A53, 在同等性能的情况下, Cortex-A55能够节省的功耗比A53提升了30%. 这对于中低端处理器是非常重要的.

全新的G76, 能带领麒麟翻身吗

麒麟980采用Mali-G76 MP10, 主频为720MHz, 相比于上一代, Mali-G76的提高单位功耗性能和单位面积性能, 性能密度相较于前代Mali-G72提高了30%, 架构效率提升了30%, 机器学习处理能力提高了2.7倍. 事实上, 相比于高通的Adreno的面前, Mali在单核心性能上一直都是弟弟. 因此Mali系列在推出时, 你经常可以看到什么MP20, MP32之类 '很吓人' 的数字. 但问题是作为一个体积基本固定的手机, 是不可能无限堆叠核心, 因此Mali在Adreno面前一直都略显孱弱.

观其历史, 通过参数对比我们可以看到, 采用Mali的两家, 三星采用的策略是低频多核心的方案, 例如Exynos 9810, 堆了18颗核心, 但主频只有546MHz, 而麒麟则是高频低核的策略, 之前的麒麟970 MP12主频为746MHz. 因此在G76中, ARM将Mali最大的可采用核心降到20个, 以提升能量密度. 这也是比较符合目前整个移动SoC的大趋势.

Mali G76采用最新基于Bifrost的架构, 与之前midgrad架构相比, Bifrost最大的创新在于使用指令组着色器(ClausedShader), 另外Bifrost架构还采用Quad based vectorization技术, 相比于之前SIMD矢量化技术一次只能执行单一线程, Quad矢量化技术最高支持四线程执行, 共享控制逻辑, 使用率接近100%. 相比于G72, G76性能密度提升了30%, 能效提高20%.

在功耗方面, 我们引用anandtech采用GFXBench Manhattan 3.1离屏的能效数据, 可以看到, 在7nm工艺下, G76 MP12的平均功率表现不错, 只有4.08W, 甚至比S9+的5.01W还低一些, 而相比于上一代的麒麟970的6.33W有了很大的提升. 而在效率上, 更是进步非常明显(注意, 这里指的是能耗, 而非绝对性能). 因此, 能耗的进步将使麒麟980成为麒麟950之后的又一代经典.

跑分测试:

首先是Geekbench, 经过我们的三次测试(取平均数), 单核成绩为3308分, 多核成绩9752分. 主要得益于A76架构和7nm工艺的提升, 麒麟980对比骁龙845也有比较明显的提升;

而在考验CPU计算能力与稳定性的圆周率的测试中, 麒麟980也给了我们一个意外的惊喜, 表现非常不错. 平均每项测试都比845略微领先.

GFXBench测试, 麒麟980的Mali-G76在Adreno面前确实还是有差距, 尽管相比前代差距已经在缩小. 但确实, 在GPU方面, Adreno还是领先于Mali.

而在3DMark的测试中, OpenGL ES 3.1为3524, Vulkan为4018. 在Vulkan下, 可以看到Mali的性能明显比OpenGL ES 3.1的更高, 甚至几乎追平了GPU方面的差距. 这也得益于麒麟近几年在Vulkan的优化. 目前比较流行的《王者荣耀》等游戏已经逐渐在从OpenGL向Vulkan转换, 而Vulkan就是安卓大型游戏的未来.

其它方面:

在ISP方面, 麒麟980采用第四代自研ISP, 像素吞吐率比上一代提升46%, 能效提升23%, 而且能够分区域调节图像色彩与灰阶, 支持更多摄像头, 还具备HDR色彩还原能力, 能够分区域调节图像色彩, 实现照片色彩与细节的平衡.

这也带来Mate 20系列强大的夜拍功能. 麒麟980针对暗光场景, 芯片采用全新Multi-pass多重降噪技术, 可精准降低夜景照片中的噪点, 保留更加完整的细节, 夜拍效果更佳通透清晰. 配合麒麟980的双核NPU, 可实现每分钟识别4500张影像, 识别速度相比上一代提升120%. 而在官方视频中, 麒麟980还能实时绘制出人体的关节和线条, 可以准确识别多种物体, 实现了从图像识别到物体检测的跨越.

而在最重要的基带方面, 麒麟980在全球率先支持LTE Cat.21, 支持业界最快的下行1.4Gbps速率, 更灵活应对全球不同运营商的频段组合. 并且值得一提的是, 华为已经为麒麟准备好Balong 5000 Modem, 为5G Solution Ready.

总结:

自麒麟950以来, 麒麟处理器逐渐站在了高端处理器的行列. 尽管并非完美, 但可以明显的感受到, 这几年麒麟一步一个脚印的在进步, 不断改进. 直到在这一代, 麒麟980无论是一些关键的核心指标, 还是其它的散发型功能, 麒麟980已经没有明显的短板, 并且在均衡的基础上, 能够发挥自己与终端紧密结合的优势, 针对用户实际的需求进一步改进, 应用在移动终端. 这才是对于华为, 对于麒麟最重要的战略意义.

2016 GoodChinaBrand | ICP: 12011751 | China Exports