用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试

"天下大势 , 分久必合 , 合久必分" , M1并不是苹果第一次改换处理器 , 早在2005年 , Mac系列就从摩托罗拉、IBM的Power系列处理器更换到英特尔酷睿处理器 。
在当年的WWDC上 , 乔布斯谈到了对Power处理器的失望:性能不足、开发路线模糊且功耗巨大 , 而这正是改换门庭的契机 。
而当我们把时间线拨到15年后的今天 , 你会发现历史总是惊人的相似 , 眼下的英特尔也正经历着性能、制程研发和功耗的瓶颈煎熬 , 所以 , 苹果推出应用于Mac系统的自研处理器其实一点儿也不让人意外 。
虽然我们在电脑端习惯于说处理器 , 但注意 , M1是苹果第一款专为Mac设计的SoC芯片 , 关键词:SoC 。 这正是M1最大的技术基础 , 接下来我们将会以此为起点并结合新款Mac mini的实际测试 , 来为大家揭开M1的真实用户体验是否如坊间传闻那般"拳打i9 , 脚踢PC"吧 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

单核性能极强 , 非专业用户日常使用OK
正如前面所说 , M1推出的契机在于X86架构处理器在肉眼可见的未来 , 并不具备苹果想要的进步幅度 , 也与苹果期望的发展方向相左 , 作为手握手机平板端最强SoC的苹果早已打造了属于自己的闭源生态圈 , 所以在Mac上完全可以移植这套"熟悉的配方" , 掌握最高级别的供应链话语权 。
但实现这一目标必须有一个大前提 , 那就是性能要足够强 , 至少要在用户端实现无感迁移 , 那M1是怎样做的呢?

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

首先是CPU单核性能的极致优化 , 一直以来苹果的SoC都是走相对低频+少核心数量+超宽架构IPC方案 , M1也不过是4大核设计 , 但在采用台积电5nm制程下足足塞入了160亿个晶体管 , 4个大核可以分配到非常充裕的晶体管资源 , 先天就相对X86竞争对手有着明显的单核性能优势 。
在Geekbench 5测试中 , 单核可以跑出惊人的1732分 , 作为对比 , 单核睿频最高可达5.1GHz的英特尔Core i7 10875H只能跑1100分出头 , 即便是放眼桌面端最强的Core i9 10900K也最多只能逼近1500分 , 与M1仍存在较大的差距 。
从程序优化的角度来说 , 调用的核心越少 , 工作效率就越高 , 所以单核性能基本决定了综合体验的下限 , M1在这方面可以说留足了性能空间 , 并且在跑Geekbench 5 CPU测试时 , CPU占用率在45~65%之间 , 平台峰值功耗也不过28W , 整机运行非常安静 , 机身外壳也基本没有发热 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

换言之 , 即便是单纯比通用计算性能 , M1也并不会比X86同功耗水准的型号差 , 甚至在对比英特尔11代低电压型号时能占得先机 , 但相较AMD 4000U系列还是有一定的差距 。
除此之外大家最关心的可能还是软件兼容性的问题 , 毕竟ARM和X86存在架构区别 , "我买M1芯片的Mac会不会用不了已经习惯了的macOS APP呢?"
M1的特殊之处在于需要应用开发商针对Universal进行升级后才能以ARM原生方式运行APP , 但好消息是我们日常使用的大多APP , 比如QQ、爱奇艺、WPS、剪映等国产APP都基本在第一时间推出了Universal版 , 可以很方便地在APP Store进行下载安装 , 因此 , 日常工作娱乐M1芯片Mac都能很好地实现兼容 , 可放心选择 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

但对于相对专业的应用来说 , 现阶段来看兼容性问题确实是存在的 , 因为目前Mac用户仍习惯于通过浏览器下载而不是通过APP Store , 所以很容易下载到无法支持的版本(当然 , 很多第三方大型专业软件本来就无法通过APP Store) 。
因此 , M1芯片的Mac系统还是更适合原本就一直使用苹果系第一方APP的用户:Final Cut Pro就第一时间进行了原生适配 , 但比如像Adobe旗下的热门软件就没有那么快了 , 最快的Lightroom CC也要12月 , Photoshop则要到2021年 , Premiere、After Efftct、Illustrator等暂时没有公布时间线 。
虽然macOS Big Sur包含了Rosetta 2编译器 , 运行可受支持的X86 Mac APP时会提示下载安装 , 但它的限制也很明显:使用AVX/AVX2/AVX512指令集的软件无法编译 , 但这恰恰是生产力软件的必备 。
除此之外 , 虚拟化X86的软件和涉及到内核模块也无法翻译 , 限制比较明显 。 而且WWDC 2020现场演示的PD虚拟化Debian 10并不是大家以为的X86版本 , 而是树莓派的Lunux版……
综上所述 , 短时间内对于需要在虚拟机环境下开发、使用第三方大型设计软件的用户来说 , M1芯片机型入手还需谨慎 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

大量专用芯片保证了高性能及低功耗
回到硬件功能上 , 作为以SoC形态出现的电脑处理器 , M1相对传统X86 CPU的优点在哪呢?先来看传统CPU是怎样处理数据的吧 , 现代CPU支持数百条指令 , 但仅仅只处理一个寄存器的数据也需要完整地跑一遍流水线 , 但即便是流水线较短的ARM架构也在10级以上 , X86则需要经历20级左右 , 能效比很低 。 虽然现代CPU大多可以将常见的指令集合 , 一次下达1条指令就能实现多个指令的并行 , 一条指令也可以同时处理多组数据以实现单指令多数据流 , 但即便是AVX512的带宽依然相对太窄 , 再加上长流水线的影响 , 所以为了提高性能就只能提高频率 , 这也就增加了功耗 , 这就是为什么低电压x86 CPU很难成为生产力工具的原因 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

既然CPU的通用计算能力如此有限 , M1的方案方向就很明确了 , 那就用上专用计算方案吧 。 于是在M1的官方结构图上 , 我们可以看到非常多的专用芯片:图像处理、视频编解码、音频处理、加密解密、神经网络……
【用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试】所以 , 这其实与手机/平板芯片是同一个路数 , 通过不走CPU流水线的专用芯片将能耗比最大化 , 进而实现高效与低功耗的兼备 。
那么 , 专用芯片的性能到底有没有说的这么厉害呢?
如果你经常使用Premiere或After Effect等视频剪辑/特效软件 , 一定会对高分辨率素材回放所造成的卡顿印象深刻 , 哪怕你电脑配置价格过万也无法避免 , 所以有时候为了提高工作效率 , 不得不依靠调低预览分辨率甚至使用代理来解决这个问题 。
但这又意味着无法直观检视色彩、细节、动态范围等关键数据 , 如果再遇上H.265编码甚至HDR内容 , 说它是视频工作者的梦魇也不为过 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

而结合专用芯片的M1表现如何呢?
我们在Final Cut Pro 10.5中调用了数段8K分辨率素材建立视频项目 , 并以"较好质量"进行实时回放 , 无论怎样拖动时间线 , 预览画面与时间线指针都能即时响应 , 并且在调整颜色、饱和度、曝光数据并小幅度裁切后也同样可以零卡顿预览 , 不需要单独渲染 , 这在传统X86处理器机型上是很难实现的 。
除此之外 , 在编辑iPhone 12 Pro Max拍摄的4K分辨率60帧Rec 2020色域H.265编码HDR视频时 , M1芯片加持的Mac mini也能做到完全流畅的回放和剪辑 , 并且平台功耗可以控制在15W以内 , CPU/GPU占用率也很低 。
我们把这一段视频放到采用Core i7 10875H处理器、32GB内存、RTX 2070独显的Windows 10笔记本上使用Premiere Pro 2020进行编辑 , 在开启硬件加速的情况下也同样会出现卡顿 。 而且平台功耗轻松超过80W , 内存更是几乎吃满 , 由此可见 , 在受支持的APP下 , 专用芯片的功能十分明显 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

同样的结论也适用于包括机器学习、数据加密、音频编码等其他专用芯片加速的项目 , 比如在djay Pro AI音频剪辑软件中 , M1就能准确识别乐曲中的节拍、鼓点和人声并支持各自分离重新混音 , 相对Windows平台的音频后期软件来说准确率要高很多 , 并且通过滑条的方式进行控制也很直观 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

当然 , 有受支持的APP就有不受支持APP , 如果是通过Rosetta 2编译后运行的第三方X86设计软件 , 因为没有专用芯片来进行硬件优化 , 所以工作效率跌幅明显 。
以Blender为例 , 使用最新的稳定版2.90.1进行云雾效果渲染 , 因为CUDA、OpenCL、OptiX等硬件加速都无法开启 , 因此即便平台功耗跑到了30W左右、CPU占用率100%、GPU超60%这种接近满载的情况下 , 渲染效率依然很低 。
在我们的Windows 10对比平台上 , 相同设置的渲染效率明显要高出很多 , 这就是此前提到的问题所在:当面对没有专用芯片优化、且并未通过Universal实现原生的第三方高负载APP时 , M1的表现会很受限 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

打破性能桎梏的片上封装内存设计
内存性能可以简单分为带宽和延迟两个维度 , 如果马力全开 , 一个3GHz的4核CPU在执行两个256bit单指令多数据流FMA指令时 , 数据带宽的需求是约为2304GB/s , 即便是双通道DDR4-3200内存的带宽也只有51.2GB/s 。
当然 , 实际应用中除了特殊的测试程序之外 , 不可能出现全速吞吐FMA指令集的情况 , 但这个差距依然是十分悬殊 , 仍有填补的必要 。
所以 , 现代CPU一般会在内核放入大容量缓存来解决这个问题 , 三级缓存的带宽是内存的7~8倍 , 延迟则只有1/5 , 效率显然更高 。 但缓存占据了大量的内核晶体管资源 , 不可能无节制地增大 。
而M1给出的解决方案则退了一步 , 通过SoC的形式将2颗LPDD44X DRAM直接封装到M1的基板上 , 这样一来 , 至少相对传统的插槽或主板焊接而言走线距离短了非常多 , 进而降低了延迟并降低功耗 。
根据已有的资料来看 , 相对板载方案 , 传输功耗的下降幅度可以达到20倍之多 , 未来如果能结合HBM2内存颗粒 , 双通道的情况下就能实现512GB/s的带宽 , 足足是DDR4-3200的10倍 。
不过 , 封装内存也就意味着完全舍弃了扩展性且容量上限也明显更低 , 这就会形成天生的用户群上限 。 3款采用M1芯片的Mac产品最大内存容量也不过16GB , macOS可不能像iOS这样通过杀进程的方式来缓解内存压力 , 并行是电脑操作的自然属性 , 所以这就注定了至少在M1这个阶段 , 它依然只能在主流定位的产品上找存在感 。
但从商业角度来说这个切入点反倒很适用 , 因为主流即代表高出货量 , 这是生态形成和用户习惯培养的根本 , M1必须能打下这个基本盘 , ARM在Mac端才能走得更远 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

为什么我们选择测试Mac mini?
M1芯片的3款机型中 , 大家可能更关注新款的MacBook Air和MacBook Pro , 不过我们知道CPU的性能往往与散热正相关 , 相对于以轻薄为主要设计方向的笔记本而言 , Mac mini虽然定位迷你 , 机身只比机顶盒大不了多少 , 但"瘦死的骆驼比马大" , 厚度依然足足有36mm , 是MacBook Pro的两倍有余 , 这就为它的散热设计保留了足够的余量 。
事实上从我们的测试来看 , 即便是运行需要编译器编译的X86高负载应用也没有出现明显的噪音 , 机身发热也几乎可以忽略 , 所以Mac mini是3款M1芯片机型中性能释放最稳定的一款 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

而且作为不需要负担屏幕、键鼠成本的迷你台式机 , Mac mini也将用户预算压力控制在了最低水准 , 可以充分利用已有的或自己更喜欢的周边硬件来展开工作 , 视频输出可以通过HDMI2.0和1个带宽达到40Gbps的雷雳/USB4来实现双显示器 。
除此之外还有1个雷雳/USB4接口 , 并预留了2个USB-A、千兆有线、3.5mm音频输出并支持WiFi6无线协议 , 对于大多数想要尝鲜更换Mac平台的用户来说 , 也是目前最实用的方案 。
当然 , 如果是重度外设用户 , 接口数量还是相对紧张的 。

用户|新款Mac mini首发体验:苹果M1芯片性能及兼容性完全测试
文章图片

采用基于ARM架构的电脑处理器方案 , 也意味着完全打通了iOS和iPadOS生态 , 毕竟这两者在各自领域都基本上稳坐头把交椅 。
M1的出现开启了苹果电脑、手机、平板生态大一统的开端 , 未来的走势就是APP端有着广泛的三者兼用基础 , 上层再发展出各自特化的APP来作为延展区分 , 这就是苹果力推M1的市场目的 , 也是为啥总有人说M1就是强化版A14Z的原因 , 其实这种说法在我看来确实是有理由的 。
将手机、平板、电脑的处理器统一的另一大优势 , 就是可充分利用规模效应来降低成本 , 即便是作为第一代产品的M1也已借由iPhone和iPad庞大的体量收获了低成本效益 。
与采用Core i5处理器的版本相比 , 同为8GB内存、512GB SSD的配置下M1版Mac mini足足便宜1500元 , 但基本的日常使用来看几乎没有差别 , 还能依靠专用芯片来给苹果系APP加上强力Buff , 可以说是优点很明显的产品 。 香!
机智猫专注数码科技 , 关注我 , 一起测新机、聊行业、学技巧~

    推荐阅读