最全面麒麟970评价:从性能, 创新和产业贡献来看一款好芯片

先谈谈怎么才算评价一颗手机芯片的正确姿势呢? 举个栗子来讲, 我们评价一个人一定是立体的, 我们评价一个人一定不会只看身高吧, 我们既要看他有什么与众不同, 也要看他有什么缺点, 更要看他对自己对周边的影响是什么对吧. 那么我们想正确 (划重点) 评价一颗手机芯片也少不了横比纵比, 哪儿好哪儿差, 以及对其行业发展的价值.

要完整全面地评价一款芯片必须能够从三个层次来看:

第一层看技术表现, 产品对产品, 技术对技术地看, 把一颗芯片按照功能模块拆开看数据看表现, 典型的比如用Geekbench测CPU性能, 用GFXBench测GPU性能, 用安兔兔测综合性能, 进一步就是能够利用自己设计的方式进一步解读, 这一类的典型代表有Anandtech, 炮神, U君的评测, 其它我觉得暂时不必看了.

第二层看创新, 只有到达顶层的玩家才谈得上会真的为创新做投入, 跟在屁股后头跑的能跟上就不错了.

第三层看产业, 看看产品对行业的影响力是什么水平.

第一层: 麒麟970的技术表现

手机处理器从技术上来分总体也就是几个模块: CPU, GPU, Modem, ISP, Audio, Video, 以后估计还会多一个NPU. 评价这些模块的技术水平我们行业内都用的是PPA (性能, 能效和面积) , 不过面积跟广大消费者没啥关系, 这次就不重点说了. 而以上几个真正比较可比的是CPU和GPU, Modem比个规格差不多了, ISP是拍照的一部分, 也比较难比, Audio都偏软了, Video也都差不多, NPU现在差不多只有麒麟970有, 我们放后面再说.

CPU性能与能效

这张图大家一看就明白了, CPU根本不是什么麒麟骁龙之争, 而是苹果完爆安卓的局面. 四颗芯片全都是10nm工艺, 为什么安卓三个都差不多, 而苹果一枝独秀呢? 其实也很简单, 苹果用了全自研架构, 而其它用的基本都是ARM标准架构. 此处预期会被喷, 说骁龙835明明用的是自研Kryo280架构啊! 是啊, 名义上是, 实际上呢?

我们把骁龙821, 骁龙835和用ARM A73的麒麟970三个芯片的Geekbench单核的单项得分放一起仔细看看 (上图) , 有没有看出骁龙两代显然不像一个妈生的, 相反骁龙830和麒麟倒是怎么看怎么像, 所以大家明白了没有, 最合理的推测是高通实际上已经放弃了自有架构转而回归ARM标准核. 那么为什么回归呢? 当然是因为骁龙821那一代的CPU做得实在失败, 功耗大得实在感人, 不得已放弃掉了. 当然, 脸面还是很重要的, 这事儿直接讲恐怕打脸, 所以应该是想尽办法保留了继续打自研Kryo旗号权利吧. 既然工艺都是10nm, 核也差不多都是ARM A73, 那么骁龙835和麒麟970的CPU的PPA就不会有大的差异, 测不测都是这结果, 不是这结果的一定是测试方法上有问题, 具体不要来问, 请自查. 实际上对芯片能效的测试对外部的人来讲实际上很难准确, 因为非常难清楚把各个模块的能耗数据摘出来, 而且由于对细节认知的不够, 也经常会得出不准确的结论. 比如业界对硬件评测算最资深的Anandtech在测试CPU能效时用的那个CPUBurn的程序就有问题, 根本没有考虑CPU的指令效率, 所以得出ARM A73比A72能效差很多的结论 (https://www.anandtech.com/show/11088/hisilicon-kirin-960-performance-and-power/4) , 如果是真的那ARM做CPU的人必须集体投江谢罪, 事实上他们还健在. 所以做评测是个严谨的活, 要用大脑想一想测出的结果合不合理, 不合理就该自己好好再看看方法, 或者索性把这个问题讲出来, 不要轻易下结论.

所以我们给麒麟970的CPU做个小结论, 麒麟970的CPU与骁龙835, 猎户座8895代表了安卓阵营最高水平, 但是跟苹果A11比差距巨大. 这里花很短篇幅说一下为什么苹果CPU性能这么强, 其实也简单, 苹果等于把A73这种两个大核合并起来变成它的大核, 单核性能自然差别很大, 但是其实代价也很大, 实际上苹果A11的一个CPU核就差不多顶麒麟970两个大核的面积, 用了两个加起来那么多的晶体管性能自然要好, 但功耗就不一定了, 所以在单核性能疯狂提升的同时, 苹果也开始配置小核了.

GPU性能与能效

一直以来, GPU实际上是网友一直都特别关心的, 因为打游戏嘛. 其实比较有趣的是重3D游戏人口在整个用户群中其实比例一直很低, 也就是这一年多时间也不知怎么的王者农药就把大家搞high了, 即便这样比例也不高, 但是因为这恐怕是用户体验直接映射到芯片的显性体现, 所以各家芯片厂商都还是很重视的. 说到这里我们简单给手机GPU的几大派归个类:

苹果是Imagination的PowerVR系列高通是自研的Adreno系列三星和华为用的ARM Mali系列行业里基本看得到的也就这三家. 先说Imagination, 算移动GPU的开山鼻祖, 但基本就是被苹果保养, 现在被苹果甩了. 其实跟苹果做生意也好也不好, 差不多就是喝毒药, 因为苹果把控力太强, 逐渐让这些厂商的能力就局限起来, 让你做什么做什么就行. 这就导致实际上对支持其它厂商用他家的GPU变得比较困难, 我们看看这两年MTK抽风去用Imagination的GPU结果出来是什么表现就明白了. 所以苹果被喂饱了后自己开干, 未来提升会比较显著.

这两年, 高通的Adreno可谓威震天下. 客观的讲, 高通的GPU确实好, 好到就靠它挽救高通渡过了骁龙810, 821这两颗不怎么成功产品的困难时期. 你要是问我好在哪儿, 对于这种系列性的好那只可能是架构了, 高通的Adreno更好地适应了移动设备对图形运算的诉求. 估计苹果也是看到靠Imagination是没戏了, 才决心自己干的吧.

再来看看Mali, ARM这公司靠CPU发达了, 就想着扩展一下业务, 把周边也做了吧. 其实一开始没两年Mali 400那一代表现是很不错的, 有点儿小闪光的样子呢, 可惜后来没有持续下去, 被高通的Adreno甩开了一截. 三星和华为其实也没什么选择, 只能上这条船, 那这个差距肿么办呢? 在半导体领域有个词叫面积换功耗, 那就多放核呗, 就好比我一对一打不过你, 多叫几个人, 每个人就都不用费很大劲, 也能把事儿办了, 唯一的代价就是芯片成本变高, 但是苹果, 三星, 华为都是自己给自己用, 所以自己承担了, 消费者并没什么损失. 我们看一下这一代的性能比较, 半斤八两, 已经被拉得平平的了.

但是, 虽然性能接近, 就代表体验一样吗? 其实这个时候能效比这个问题就体现出来了, 能效比就是做同样的事情消耗多少电, 在行业内会准确到焦耳/帧这样的方式. 但是外界没办法去测, 而高通的GPU在这点上的优势非常明显, 而且越重载越明显. 能效好就意味着发热少, 发热少就意味着芯片到达热保护的时间越长, 触发热保护的时间越长就意味着降频, 降频就意味着卡顿. 实际上为了保证游戏的帧率稳定, 各个手机厂家和游戏厂家在策略上都会做一些考虑, 比如限制帧率在30fps-40fps, 这个时候GPU的工作负载不会很高, 发热就比较少, 能够保持, 但是当打开60fps时连续跑就会明显感觉发热, 然后就会有不定期的卡顿, 所以对于重型的3D游戏而言的表现是骁龙835﹥麒麟970﹥猎户座8895.

刚刚提到, 能效比的优势更主要体现在重载的情况下, 所以是跑benchmark的时候差距最大, 跑重型3D游戏时次之, 而跑比例最多的中低负载游时则, 这种情况下差距幅度会明显缩小. 我一直想说的是我们做芯片的设计芯片时, 谁特么会是以长时间跑满设计的, 都是以跑在70%甚至更低的性能点而设计, 最高性能点从来都是为短时间峰值而设计, 测那个点有多大意义呢? 另外这方面其实很难测试测准, 因为只能取电池端的电流数据, 但是这个数据包含了整机全部的功耗, 要把其它部件准确排除掉是不大可能的. 如果大家实在感兴趣也可以参考U君的游戏测试, 虽然也不是那么准, 但是还是可以看看的. 说到这儿想起个题外话, U君前一阵出了个麒麟970的评测, 结论是麒麟970能效相比骁龙835差距很大. 这一下有些人就像被捅到G点一样那个兴奋啊, 各种群好一通转, 我看了就觉得好笑, 你想说明啥呢? 做好做坏都是人家老外的事儿, 圈里海思展讯的人家还好歹还能自己做点儿主呢, 你这在产品上插不上话的有啥好兴奋的.

GPU其实还没说完, 上面讲的是绘图能力, 实际上GPU的数据并行特性还可以做更多的事情, 各家GPU除了绘图, 都设计了对Computing的支持, 体现在基于OpenCL标准的应用场景上, 实际上很多界面效果都是用OpenCL (行业标准) 或者RenderScript (Google) 来实现了, 而后续基于GPU的神经网络运算也会基于OpenCL来做. 这部分的性能因为不那么显性所以外行并不很关注, 但是这是GPU不可缺少的部分能力, 实际上安兔兔和Geekbench都有测试, 以Geekbench为例大家看看麒麟970性能是什么水平. 大家可以看到GPU Computing的性能水平是: 猎户座8895≈麒麟970﹥骁龙835. 由此可见, 高通的Adreno GPU在设计上是偏向绘图的, 而Mali则考虑Computing会更多一些.

写到这总结一下麒麟970的GPU, 绘图理论性能追平了骁龙835和猎户座8895, 但能效的差距还是明显. 回顾一下麒麟950, 960到现在970的情况, 看得出海思改善GPU性能和能效比的决心还是很大的. (下图)

第二层: 麒麟970的技术创新

麒麟970这一代在AI上的创新恐怕大家都看到了, 这一次和苹果并肩站在了行业最前列. 实际上创新的不是AI本身, 而是加了个NPU进去. 不要小看这个硬件, 芯片设计中对加入一个独立新模块素来是很谨慎的, 因为首先芯片那可真是寸土寸金, 每增加一块面积都是成本, 如果增加的这一块儿成本是两毛美金 ($0.2) , 按照出货5000万来算那就是1000万美金的利润啊. 第二新的硬件需要融合进真个系统, 对系统整个软件架构是有很大的工作量的, 这也都是成本. 所以芯片公司会在这方面非常谨慎, 只有确信能被广泛用起来才会加入. 那么为什么苹果和华为这样做了而高通却没有呢? 其实很简单, 原因是高通是卖芯片的, 它怎么确信自己客户能用起AI来呢, 万一用不起来这个成本不就白加了. 而苹果和华为是自己给自己用的, 当然知道加的NPU能不能用起来, 当然能够更容易的下这种创新的决定. 所以未来, 大家等着瞧, 同样的原因, 苹果, 华为和三星这BIG3肯定会在创新上更激进, 而高通会相对保守.

回过来我们看看麒麟970在AI领域的创新是什么概念, 什么程度, 有什么价值.

现在AI领域的基本方法并不是什么新鲜东西, 二三十年前就有了, 问题一直被计算性能限制着. 你想啊, 你一个算法要跑好几天还有P用. 这个问题首先在学习侧被高速发展的英伟达用几年时间很大程度的缓解了, 谷歌做了TPU2出来也很大程度降低了学习侧的门槛. 这样好了, 一定会涌出大量AI的算法和模型出来, 大家做这些不就是为了用吗? 但是拿到了手机上跑不动是不是想死. 事实上确实手机的AI inference性能成为AI应用普及的最大瓶颈. 所以苹果和华为就加了NPU啊, 我有些不理解这么明显的趋势高通怎么会这么保守, 你可是当年业界老大啊, 现在怎么保守成这样.

那么麒麟970的AI性能相比苹果的A11是怎样呢? 根据它发布会公布的数据来看, 下面这张最有参考价值, 因为表明了是在哪些网络下对比的, 整体看是明显高于苹果A11的. 不过根据苹果的资料, 目前它的Neural Engine只用于内置Face ID应用, 并没有开放给开发者, Core ML只能访问到基于GPU的神经网络加速. 所以以此判断对于AI应用的开发者而言, 无论能效还是性能肯定还是麒麟970更好. 从这点看海思还是很牛逼的.

有人会说骁龙835虽然没有硬件单元, 但是有DSP或者GPU, 也不能算没有AI能力. 我想说的是这就是典型的保守, 觉得不加成本就可以勉强支持挺好. 用这个DSP或者GPU来跑肯定干不过硬件逻辑啊, 更何况这些都是共享资源, 你一个应用在跑的时候, 能分给AI多少呢?

好, 总结一下创新层面, 显然麒麟970这次向前跨了一大步, 成为了手机AI芯片事实的领导者, 这一点甩出骁龙835和猎户座8895好几条街.

第三层: 麒麟970对产业的贡献

实际上我们可以对每一代麒麟芯片有个一句话的评价:

麒麟950: 第一个跻身顶级手机SoC处理器行列的麒麟芯片麒麟960: 水桶芯麒麟970: 业界第一个真正意义上的手机AI处理器大家可以从上面这几句话感受一下麒麟970的行业意义, 我从几个维度进一步为大家撸撸:

1, 在Android还没有明确想法的情况下, 海思大胆地做出了这个创新, 并且还为之开发了一整套开发套件, 这是个很有思想的动作, 也是安卓领域第一个敢于跨出这第一步的玩家

2, 帮助寒武纪从一个实验室成果变成了产品化的东西, 对整个中国的AI芯片领域带出了一大批有经验的人才和成果

3, 解锁一批长期因为受限于手机AI性能而无法落地的应用开发者, 可以预期会带动一波AI应用出现在用户面前, 并且这一波开发者和体验会首先出现在中国

4, 实质性加速了整个手机芯片圈对AI的判断, 更多的投资会进入, 更多的业务会被挖掘出来

以上这些从我们从业者角度来看可以说有非常非常重大的意义, 而且海思素来是中国半导体领域的黄埔军校, 亲爱的米粉们, 你们寄予厚望的松果不也是海思出来的人在担纲吗?

如果让我为麒麟970写一段评语, 我会这么写: 麒麟970是华为的一次勇敢尝试, 尝试卓尔不群, 尝试跨出领先的这一步. 手机芯片产业会记住它, AI产业也会记住它. 更重要的是它不是别人做出来的, 而就是你我身边的普通人做出来的, 这深深鼓舞了我们!

附1: 麒麟970行业水平整体对比一览 (1-5分制)

附2: 本文主要参考数据来源

Geekbench: https://browser.geekbench.com/v4/cpu/singlecore

GFXBench: https://gfxbench.com/result.jsp

原文转自知乎专栏作者: whoknows

2016 GoodChinaBrand | ICP: 12011751 | China Exports