华为海思Kirin 960芯片:细看其性能与功耗
2018-06-06 06:10:37 来源:网络整理 作者:秋军

为了了解CPU功耗,我们采用不同线程数来人为加载核心(译者注:原文是说用power virus来测试,直译就是功率病毒,这里可译作功耗程序)。借由每台设备自带的数据来做计算,从相应场景的总功率减去闲置功率(仅显示静态屏幕所需资源),得到表中所谓的Active Power消耗功率。这种统计方法并不完美,而且也没有可将既定块消耗资源单独出来的方式,比如SoC互联、内存控制器或者DRAM,所以下面这些数据包含了一些增量。下面的“1 Core”列数据更靠谱。
比较意外的是,Kirin 960的CPU大核心相较Kirin 950的A72消耗了更多资源,最大差距达到了43%!这和ARM自身制定A73的目标是相悖的,原本ARM宣称A73能够节约能耗,加强持续性能。我们无从了解,为何Kirin 960在最高频率下功率更高,这可能与工艺和实施方案都是有关的。
Kirin 950采用台积电的16FF+ FinFET工艺,不过针对Kirin 960,海思则转而采用台积电的16FFC FinFET工艺。更新版本的16FFC工艺减少了生产成本和die尺寸,令其在中端和低端市场更具竞争力。台积电还宣称,这种工艺能够低于0.6V运行,减少泄露和动态能耗,所以它很适合可穿戴设备和IoT产品。所以这是定位于对价格比较敏感的市场,外加超低功耗的可穿戴设备的,这种工艺倾向于采用更低的频率运行,而非像Kirin 960这样的2.36GHz频率。将定位性能更低、以更低电压和频率为目标的16FFC工艺,应用更高的频率,令其突破效能临界点,可能就是其功耗更高的原因所在。
Kirin 960和950的上述差异应该不止是工艺的关系。架构的具体实施方案在其中扮演更重要的角色。海思在16FF+工艺的Kirin 950的表现上很好,所以其效率也不错。要达到这样的表现本来就有难度,更何况还有16FF+与16FFC的差别,需求不同,工艺也不同。我们无从了解海思在这颗芯片上的表现与最优方案有多大差距,因为没有其他16FFC工艺的A73 CPU可作比较。
Kirin 960的峰值功率数值和Kirin 955(高频版Kirin 950)很接近。其单核方面的功率提升和Exynos 7420频率更低的A57核心接近,只少了50mW。
Kirin 960的A73核心相比骁龙820/821中的两个高性能Kryo核心功耗更低,最高为2.8W——后者最高为3.1-3.3W。骁龙的四颗核心中有两个是以更低频率运行的,功耗也更低,所以在3-4个核心一起运行的时候,Kirin 960的功耗优势就不存在了。
PCMark续航测试,单位小时,越高越好
华为Mate 9虽然在功率峰值状态的功耗更高,但在我们的电池续航测试中却表现得很不错。在WiFi网页浏览-屏幕长开测试中续航时间13.25小时,比Mate 8多出3个小时,而PCMark 2.0测试则接近10个小时,比Mate 8多出27%。续航成绩和我们在CPU功耗方面的数据是相悖的。

上图展示了Mate 9在跑PCMark 2.0性能测试的时候,总的系统功耗变化(所有无线信号全部切断,屏幕亮度降低至10nits)。除了某些情况下会形成功率峰值,总的功率维持在3W以下,一般都低于2W,也都远低于我们测试Kirin 960四个大核心并开时的5.3W。
(译者注:原文并没有对Power Comsumption与Energy Comsuption进行区分,文章中许多地方表达的“功耗”一词,意思和功率差不多,单位为瓦特或毫瓦;而文中出现“能耗”一词时,英文表达为Energy Consumption,则是指具体消耗了多少能量,单位为焦耳。1瓦特=1焦耳/秒。
但有时,文章对这两个词进行了混用;这里对功耗和能耗这两个中文表达的区分不够规范和严谨。文中不再作另外说明。)
展示这张图是因为我们日常使用的绝大部分应用行为,和PCMark都比较类似,从小核心到大核心的线程切换,还有DVFS工作令负载与CPU频率相匹配(不过绝大部分日常应用会表现出明显更多的CPU闲置时间,从这个角度来看,PCMark还是略显偏激)。许多任务负载也只用1-2个大核心,PCMark也是如此。在两个核心以最高频率运行的时候,Kirin 960相较950功耗多出754mW,而在开启四个核心的时候则多1601mW。所以说,虽然CPU效能是比较重要的,但还需要与具体日常使用中的工作负载相结合。


光看功率值是不行的,一台设备可能比另一台设备功率更高,但完成任务的时间也更短,或者实际上其能耗更少,续航更久。对于上面两张图来说,手机的无线电都已关闭,显示屏亮度调整到仅10nits(常规最低设置)来减少不同屏幕尺寸和效能的屏幕对于结果的影响。
第一张图展示了手机运行PCMark 2.0性能测试时的总能耗,Mate 9相比Mate 8整体多出16%的能耗(虽然我们尽可能让屏幕的影响最小,P9的能耗还是比Mate 8略低,这和更小的屏幕尺寸可能也是有关系的)。视频和照片编辑测试项(Video和Photo Editing)会启用GPU,这类测试会表现出最大化差异;写入测试(Writing),会频繁用到CPU大核心,这项测试相比平均水准也会表现出更大的差异。乐视Pro3手机,及其骁龙821 SoC在数据操作与写入测试(Data Manipulation和Writing)中的确相比Mate 9能耗更大,用上了2个高性能的Kryo核心;不过在用到GPU的视频与照片编辑测试中,Mate 9和Kirin 960就没有优势了。
第二张图将PCMark的得分除以能耗,用以表现效能。由于Mate 9性能更出色,所以在写入(Writing)测试中,效能比Mate 8高出7%,在数据操作(Data Manipulation)测试中效能高出17%。不过Mate 9的GPU效能是这组测试中最差的,从视频与照片编辑测试(Video与Photo Editing)就能看得出来。相较之下乐视Pro3的Adreno 530 GPU在这些测试中效能就明显更好了。

虽然Kirin 960 SoC能耗更大,不过在PCMark的电池续航测试中,Mate 9相比Mate 8却续航更久,这么看来华为必然是在手机的其它部分减少了能耗。显示屏就成为最值得观察的部件,上图很清晰地展示了Mate 9的屏幕明显更省电。在200nits亮度下(我们用于电池测试的值),Mate 9功耗少了约19%。运行PCMark的时间,可转化为82J能量,基本消除了Mate 9和Mate 8之间102J的差距。我怀疑,这里显示屏功率方面的差异可能略大了一点,我们没有设备能够进行更准确的测试。这仍然无法完整地说明Mate 9功耗究竟省在了哪些地方,这也脱离了这篇文章讨论的范畴。
CPU热稳定性
我们的CPU调节测试,还是用上了前面的功耗程序(power virus),2个线程跑在2个A73大核心之上,跑大约30分钟。目标是要看设备维持CPU峰值性能的能力,也就是不对用户体验造成太大的影响。这也考验设备的散热能力,以及设备对于温度的安全限制。

Mate 8及其Kirin 950几乎能够毫无限制地让两颗A72核心维持住峰值性能,这可称得上牛逼了。Mate 9的表现就没有那么好了,因为Kirin 960用上了更高的功率。不过即便如此,Kirin 960依旧能够让两颗A73核心在峰值频率上运行11.3分钟,而且在20分钟的时间里对于频率的调整都没有对性能产生实际的影响,这仍然是非常出色的成绩。至少我没有想到其它手机的CPU工作负载,能够以这样的表现加载两颗大核心。所以仍然可以说,对Mate 9而言,CPU频率调节并不是个问题。这样一来,华为更小的手机,比如P10是否也能够有这样的表现就更值得观察了,毕竟更小的设备无法获得大设备那样的散热表现。
GPU功耗与热稳定性
GPU功耗
Kirin 960采用ARM最新的Mali-G71 GPU,先前的Kirin SoC为了平衡性能和功耗普遍用上了更少的GPU核心,这次Kirin 960的GPU也上了八个核心,显然是开始专注于峰值性能了。更多的核心也意味着更高的功率,持续性能表现可能是很多人关心的。
我们针对GPU功耗测试的方法和CPU部分是类似的。运行GFXBench Manhattan 3.1和T-Rex离屏性能测试(译者注:这里吐槽一句,不知道是哪个恶劣的译者首先把offscreen这个词翻译成了“离屏”,不仅难听到爆,而且一般国人也无法理解,还离屏,怎么不说离婚?),我们在运行每项测试时,从总的消耗功率(Active Power)中减去闲置功率,来计算系统负载功率——用的是每台设备自己提供的数据。

GFXBench曼哈顿3.1离屏能效表现,第二列为GPU的工艺制程,第三列为运行帧率-越高越好,第四列为平均功率-越低越好,第五列为每瓦特的帧率-越高越好
Mate 9的8.63W平均功率成为全组最高,对于智能手机的SoC而言的确是不大能接受的。GPU功耗这么高,就算同时只有1个A73 CPU核心跑在最高频率下,TDP都不可能不超过10W,这可能对于一台大型平板来说是可以接受的。Mate 9的GPU核心也达到了1037MHz,这也是不大合理的。相较而言,采用三星14LPE FinFET工艺的Exynos 7420,同样也是八核Mali GPU(不过是更老的Mali-T760),频率最高也就772MHz,这样才保持其平均功率低于5W。
Mate 9的平均功率相比Mate 8高出3.1倍,不过由于峰值性能也提升了差不多的量,能效基本也就持平了。高通骁龙820/821采用的Adreno 530 GPU在相同的负载下很轻易地达到了最佳效能;相较Kirin 960达到相同性能表现,前者只用了不到一半的功率。

在T-Rex测试中,Kirin 960的表现更糟,平均功率增加到9.51W,且GPU能效达到有史以来我们测试过所有设备的最低值。作为对比,三星Galaxy S7所用的Exynos 8890采用12核心Mali-T880 GPU,最高频率是650MHz,平均功率4.7W,能效高出了78%。
我们测试过的所有旗舰SoC,包括苹果、高通和三星,在这项测试中触顶也就5W的程度。即便如此,由于运行中温度升高,这些SoC都无法维持峰值性能较长时间。理想化的情况是手机在这项测试中功率低于4W,提升到5W以上是相当不合理的。

Kirin 960更高的功耗对于Mate 9游戏时的续航是有负面影响的。相较Mate 8,其运行时间少了1个小时,整体低了22%,这和Mate 9在测试中不对GPU频率进行适当的限制显然是有关的。所以,Mate 9在此项测试中的续航时间和其它旗舰手机相似(但其它手机电池容量更小),性能表现相当或更佳。为了进一步了解Kirin 960这种较高的GPU功耗,却在我们的游戏测试中表现出可接受的电池续航的原因,我们需要进一步探寻测试中其行为。
GPU热稳定性

GFXBench曼哈顿3.1/Metal系统总功率 vs GPU频率,橙色曲线代表系统功率,蓝色曲线代表GPU频率;横轴时间单位分钟,橙色曲线纵轴单位瓦特(W),蓝色曲线纵轴单位MHz
Mate 9在降低GPU频率之前,仅维持住了峰值性能约1分钟,8分钟后帧率掉到21fps,相较峰值降低38%。在大约30分钟后开始平稳,帧率保持在19fps上下,这个成绩依然比采用Kirin 950/955的手机更好——后者峰值帧率为11.5fps,平稳状态下是9-11fps。这样的表现和采用骁龙820/821的手机差不多,或者更好。比如说Moto Z Force Droid能够维持近18fps的峰值性能大约12分钟,稳定状态下帧率为14.5fps,乐视Pro3峰值表现33fps,稳定帧率19fps。
上面的第二张图,表现这项游戏续航测试前15分钟的功耗变化。可以看到一旦GPU降到533MHz,平均功耗就降到了4W以下——此刻的性能依然与其它旗舰SoC处于同等水平。这说明华为/海思针对Kirin 960的GPU可能应该选择650MHz-700Mhz的最高频率。将GPU频率推高到1037MHz的唯一原因,应该就是要让设备规格看起来更好,以及在跑分测试中得分更高。
实际上降低其GPU频率并不会提升Kirin 960在GPU低频率下的效能。因为现在我们没有其它采用Mali-G71的SoC可对比,我们也就无法下结论说上面的测试结果就是ARM这款最新GPU微架构的表现。
总结
海思Kirin 950先前就表现出了出色的性能和效率,这让我们对其继任者有了更高的期待。至少从纸面数据来看,Kirin 960各方面的表现都更好。这颗SoC采用ARM最新IP,包括A73 CPU和更多核心的Mali-G71 GPU,还有CCI-550互联总线。其他方面也有提升,如更新的modem,支持更快的LTE速度,另外还支持UFS 2.1。但在性能和效能方面,Kirin 960的表现是好坏参半的。
在处理整型工作任务的时候,Kirin 960的A73 CPU核心相比950的A72的确一定程度上更快,相比高通的Kryo和更早的A57核心优势也更大。而在浮点运算IPC方面,结果就相反了,高通的Kryo和Kirin 950的A72核心相比960的A73成绩更好。
某些性能方面的退步可能与Kirin 960的存储性能表现有关。其更大的64KB L1缓存在延迟和读取带宽方面有提升,但写入带宽相较Kirin 950更低。且960的L2缓存带宽,无论是读还是写都更低。其主存储延迟提升了25%,而带宽提升则有69%。

Kirin 960比较让人失望(以及令人疑惑的)的地方在于CPU效能比950差。ARM其实在A73的功耗方面,相较A72是做了很多工作的。悲剧的能效表现,和海思的具体实施方案,以及采用16FFC工艺可能都是有关系的。不过Mate 9的续航表现却更好了,因为手机其它组件更省电,比如显示屏,抵消了SoC功耗提升的问题。但不难想见,其电池续航表现原本是可以更好的。
Kirin 960的GPU效能更糟,其峰值功耗对于一款手机而言甚至是完全不合理的。这可能与其具体实施方案和工艺都是有关系的,而且最高频率还上了极为激进的1037MHz,这只能让配置规格和跑分结果看起来更好。
所以Kirin 960很难界定,我们无法确切地说它相较950是种升级,但我们也不能忽略忽略其全方位的努力。比如说,在实际负载中,其相较950的整数运算性能提升,及其更低的系统存储延迟。我们也不能全面否定其GPU,因为其性能维持得不错,相较其它旗舰手机表现相当或者更好,而且游戏续航也还不错。Mate 9也证明了Kirin 960的确是称职的旗舰SoC,华为也针对短板付出了努力。但在新一代10nm SoC即将全面铺货的当下,这些短板只会变得愈加明显。52RD.com 微博关注: 微信关注:admin_52RD
暂时禁止评论













闽公网安备 35020302000061号