ZKX's LAB

新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试

2020-11-17新闻33

“天下大势,分久必合,合久必分”,M1并不是苹果第一次改换处理器,早在2005年,Mac系列就从摩托罗拉、IBM的Power系列处理器更换到英特尔酷睿处理器。

在当年的WWDC上,乔布斯谈到了对Power处理器的失望:性能不足、开发路线模糊且功耗巨大,而这正是改换门庭的契机。

而当我们把时间线拨到15年后的今天,你会发现历史总是惊人的相似,眼下的英特尔也正经历着性能、制程研发和功耗的瓶颈煎熬,所以,苹果推出应用于Mac系统的自研处理器其实一点儿也不让人意外。

虽然我们在电脑端习惯于说处理器,但注意,M1是苹果第一款专为Mac设计的SoC芯片,关键词:SoC。这正是M1最大的技术基础,接下来我们将会以此为起点并结合新款Mac mini的实际测试,来为大家揭开M1的真实用户体验是否如坊间传闻那般“拳打i9,脚踢PC”吧。

单核性能极强,非专业用户日常使用OK

正如前面所说,M1推出的契机在于X86架构处理器在肉眼可见的未来,并不具备苹果想要的进步幅度,也与苹果期望的发展方向相左,作为手握手机平板端最强SoC的苹果早已打造了属于自己的闭源生态圈,所以在Mac上完全可以移植这套“熟悉的配方”,掌握最高级别的供应链话语权。

但实现这一目标必须有一个大前提,那就是性能要足够强,至少要在用户端实现无感迁移,那M1是怎样做的呢?

首先是CPU单核性能的极致优化,一直以来苹果的SoC都是走相对低频+少核心数量+超宽架构IPC方案,M1也不过是4大核设计,但在采用台积电5nm制程下足足塞入了160亿个晶体管,4个大核可以分配到非常充裕的晶体管资源,先天就相对X86竞争对手有着明显的单核性能优势。

在Geekbench 5测试中,单核可以跑出惊人的1732分,作为对比,单核睿频最高可达5.1GHz的英特尔Core i7 10875H只能跑1100分出头,即便是放眼桌面端最强的Core i9 10900K也最多只能逼近1500分,与M1仍存在较大的差距。

从程序优化的角度来说,调用的核心越少,工作效率就越高,所以单核性能基本决定了综合体验的下限,M1在这方面可以说留足了性能空间,并且在跑Geekbench 5 CPU测试时,CPU占用率在45~65%之间,平台峰值功耗也不过28W,整机运行非常安静,机身外壳也基本没有发热。

换言之,即便是单纯比通用计算性能,M1也并不会比X86同功耗水准的型号差,甚至在对比英特尔11代低电压型号时能占得先机,但相较AMD 4000U系列还是有一定的差距。

除此之外大家最关心的可能还是软件兼容性的问题,毕竟ARM和X86存在架构区别,“我买M1芯片的Mac会不会用不了已经习惯了的macOS APP呢?”

M1的特殊之处在于需要应用开发商针对Universal进行升级后才能以ARM原生方式运行APP,但好消息是我们日常使用的大多APP,比如QQ、爱奇艺、WPS、剪映等国产APP都基本在第一时间推出了Universal版,可以很方便地在APP Store进行下载安装,因此,日常工作娱乐M1芯片Mac都能很好地实现兼容,可放心选择。

但对于相对专业的应用来说,现阶段来看兼容性问题确实是存在的,因为目前Mac用户仍习惯于通过浏览器下载而不是通过APP Store,所以很容易下载到无法支持的版本(当然,很多第三方大型专业软件本来就无法通过APP Store)。

因此,M1芯片的Mac系统还是更适合原本就一直使用苹果系第一方APP的用户:Final Cut Pro就第一时间进行了原生适配,但比如像Adobe旗下的热门软件就没有那么快了,最快的Lightroom CC也要12月,Photoshop则要到2021年,Premiere、After Efftct、Illustrator等暂时没有公布时间线。

虽然macOS Big Sur包含了Rosetta 2编译器,运行可受支持的X86 Mac APP时会提示下载安装,但它的限制也很明显:使用AVX/AVX2/AVX512指令集的软件无法编译,但这恰恰是生产力软件的必备。

除此之外,虚拟化X86的软件和涉及到内核模块也无法翻译,限制比较明显。而且WWDC 2020现场演示的PD虚拟化Debian 10并不是大家以为的X86版本,而是树莓派的Lunux版……

综上所述,短时间内对于需要在虚拟机环境下开发、使用第三方大型设计软件的用户来说,M1芯片机型入手还需谨慎。

大量专用芯片保证了高性能及低功耗

回到硬件功能上,作为以SoC形态出现的电脑处理器,M1相对传统X86 CPU的优点在哪呢?先来看传统CPU是怎样处理数据的吧,现代CPU支持数百条指令,但仅仅只处理一个寄存器的数据也需要完整地跑一遍流水线,但即便是流水线较短的ARM架构也在10级以上,X86则需要经历20级左右,能效比很低。

虽然现代CPU大多可以将常见的指令集合,一次下达1条指令就能实现多个指令的并行,一条指令也可以同时处理多组数据以实现单指令多数据流,但即便是AVX512的带宽依然相对太窄,再加上长流水线的影响,所以为了提高性能就只能提高频率,这也就增加了功耗,这就是为什么低电压X86 CPU很难成为生产力工具的原因。

既然CPU的通用计算能力如此有限,M1的方案方向就很明确了,那就用上专用计算方案吧。于是在M1的官方结构图上,我们可以看到非常多的专用芯片:图像处理、视频编解码、音频处理、加密解密、神经网络……

所以,这其实与手机/平板芯片是同一个路数,通过不走CPU流水线的专用芯片将能耗比最大化,进而实现高效与低功耗的兼备。

那么,专用芯片的性能到底有没有说的这么厉害呢?

如果你经常使用Premiere或After Effect等视频剪辑/特效软件,一定会对高分辨率素材回放所造成的卡顿印象深刻,哪怕你电脑配置价格过万也无法避免,所以有时候为了提高工作效率,不得不依靠调低预览分辨率甚至使用代理来解决这个问题。

但这又意味着无法直观检视色彩、细节、动态范围等关键数据,如果再遇上H.265编码甚至HDR内容,说它是视频工作者的梦魇也不为过。

而结合专用芯片的M1表现如何呢?

我们在Final Cut Pro 10.5中调用了数段8K分辨率素材建立视频项目,并以“较好质量”进行实时回放,无论怎样拖动时间线,预览画面与时间线指针都能即时响应,并且在调整颜色、饱和度、曝光数据并小幅度裁切后也同样可以零卡顿预览,不需要单独渲染,这在传统X86处理器机型上是很难实现的。

除此之外,在编辑iPhone 12 Pro Max拍摄的4K分辨率60帧Rec 2020色域H.265编码HDR视频时,M1芯片加持的Mac mini也能做到完全流畅的回放和剪辑,并且平台功耗可以控制在15W以内,CPU/GPU占用率也很低。

我们把这一段视频放到采用Core i7 10875H处理器、32GB内存、RTX 2070独显的Windows 10笔记本上使用Premiere Pro 2020进行编辑,在开启硬件加速的情况下也同样会出现卡顿。而且平台功耗轻松超过80W,内存更是几乎吃满,由此可见,在受支持的APP下,专用芯片的功能十分明显。

同样的结论也适用于包括机器学习、数据加密、音频编码等其他专用芯片加速的项目,比如在djay Pro AI音频剪辑软件中,M1就能准确识别乐曲中的节拍、鼓点和人声并支持各自分离重新混音,相对Windows平台的音频后期软件来说准确率要高很多,并且通过滑条的方式进行控制也很直观。

当然,有受支持的APP就有不受支持APP,如果是通过Rosetta 2编译后运行的第三方X86设计软件,因为没有专用芯片来进行硬件优化,所以工作效率跌幅明显。

以Blender为例,使用最新的稳定版2.90.1进行云雾效果渲染,因为CUDA、OpenCL、OptiX等硬件加速都无法开启,因此即便平台功耗跑到了30W左右、CPU占用率100%、GPU超60%这种接近满载的情况下,渲染效率依然很低。

在我们的Windows 10对比平台上,相同设置的渲染效率明显要高出很多,这就是此前提到的问题所在:当面对没有专用芯片优化、且并未通过Universal实现原生的第三方高负载APP时,M1的表现会很受限。

打破性能桎梏的片上封装内存设计

内存性能可以简单分为带宽和延迟两个维度,如果马力全开,一个3GHz的4核CPU在执行两个256bit单指令多数据流FMA指令时,数据带宽的需求是约为2304GB/s,即便是双通道DDR4-3200内存的带宽也只有51.2GB/s。

当然,实际应用中除了特殊的测试程序之外,不可能出现全速吞吐FMA指令集的情况,但这个差距依然是十分悬殊,仍有填补的必要。

所以,现代CPU一般会在内核放入大容量缓存来解决这个问题,三级缓存的带宽是内存的7~8倍,延迟则只有1/5,效率显然更高。但缓存占据了大量的内核晶体管资源,不可能无节制地增大。

而M1给出的解决方案则退了一步,通过SoC的形式将2颗LPDD44X DRAM直接封装到M1的基板上,这样一来,至少相对传统的插槽或主板焊接而言走线距离短了非常多,进而降低了延迟并降低功耗。

根据已有的资料来看,相对板载方案,传输功耗的下降幅度可以达到20倍之多,未来如果能结合HBM2内存颗粒,双通道的情况下就能实现512GB/s的带宽,足足是DDR4-3200的10倍。

不过,封装内存也就意味着完全舍弃了扩展性且容量上限也明显更低,这就会形成天生的用户群上限。3款采用M1芯片的Mac产品最大内存容量也不过16GB,macOS可不能像iOS这样通过杀进程的方式来缓解内存压力,并行是电脑操作的自然属性,所以这就注定了至少在M1这个阶段,它依然只能在主流定位的产品上找存在感。

但从商业角度来说这个切入点反倒很适用,因为主流即代表高出货量,这是生态形成和用户习惯培养的根本,M1必须能打下这个基本盘,ARM在Mac端才能走得更远。

为什么我们选择Mac mini进行测试?

M1芯片的3款机型中,大家可能更关注新款的MacBook Air和MacBook Pro,不过我们知道CPU的性能往往与散热正相关,相对于以轻薄为主要设计方向的笔记本而言,Mac mini虽然定位迷你,机身只比机顶盒大不了多少,但“瘦死的骆驼比马大”,厚度依然足足有36mm,是MacBook Pro的两倍有余,这就为它的散热设计保留了足够的余量。

事实上从我们的测试来看,即便是运行需要编译器编译的X86高负载应用也没有出现明显的噪音,机身发热也几乎可以忽略,所以Mac mini是3款M1芯片机型中性能释放最稳定的一款。

而且作为不需要负担屏幕、键鼠成本的迷你台式机,Mac mini也将用户预算压力控制在了最低水准,可以充分利用已有的或自己更喜欢的周边硬件来展开工作,视频输出可以通过HDMI2.0和1个带宽达到40Gbps的雷雳/USB4来实现双显示器。

除此之外还有1个雷雳/USB4接口,并预留了2个USB-A、千兆有线、3.5mm音频输出并支持WiFi6无线协议,对于大多数想要尝鲜更换Mac平台的用户来说,也是目前最实用的方案。

当然,如果是重度外设用户,接口数量还是相对紧张的。

采用基于ARM架构的电脑处理器方案,也意味着完全打通了iOS和iPadOS生态,毕竟这两者在各自领域都基本上稳坐头把交椅。

M1的出现开启了苹果电脑、手机、平板生态大一统的开端,未来的走势就是APP端有着广泛的三者兼用基础,上层再发展出各自特化的APP来作为延展区分,这就是苹果力推M1的市场目的,也是为啥总有人说M1就是强化版A14Z的原因,其实这种说法在我看来确实是有理由的。

将手机、平板、电脑的处理器统一的另一大优势,就是可充分利用规模效应来降低成本,即便是作为第一代产品的M1也已借由iPhone和iPad庞大的体量收获了低成本效益。

与采用Core i5处理器的版本相比,同为8GB内存、512GB SSD的配置下M1版Mac mini足足便宜1500元,但基本的日常使用来看几乎没有差别,还能依靠专用芯片来给苹果系APP加上强力Buff,可以说是优点很明显的产品。香!

机智猫专注数码科技,关注我,一起测新机、聊行业、学技巧~

#英特尔#wwdc

随机阅读

qrcode
访问手机版