一个专门做 CPU 的厂商,非常自豪的说“我们超越 Apple M1 max 了”
这张图来自于CES 2022上Intel的12代移动处理器PPT,[1]留意脚注:
Intel关于这张图的性能测试说明:[2]
Claim:
12th Gen Intel Core i9-12900HK is the fastest mobile processor ever.
Systems Measured:
Processor: 12th Gen Intel® Core™ i9-12900HK processor, 14C24T; tested on Intel Internal Reference platform; Memory: 2x32GB DDR5-4800Mhz; Storage: Samsung PM9A1 - MZVL2512HCJQ-00A00; Display Resolution: 1920x1080; OS: Microsoft Windows 11 Enterprise 10.0.22000.282(Win11 RTM); Edge Version:90.0.818.66; Graphics card: Intel(R) Iris(R) Xe Graphics; Graphics Driver:30.0.101.1029. Max GFX power:165W, BIOS version:0.043; GPU Mode: N/A; Power Plan set to Balanced, Power Mode (Win 11 feature) set to Best performance; Power App Setting (OEM's App): N/A, VBS enabling, Defender enabled, and Tamper Protection enabled.
Processor: 11th Gen Intel® Core™ i9-11980HK processor, 8C16T; Tested on Intel Reference platform; Memory: 2X 16 GB DDR4- 3200MHz; Storage: Samsung PM9A1 - MZVL2512HCJQ-00A00; Display Resolution: 1920x1080; PC BIOS version:4303_03_103;OS: Microsoft Windows 11 Enterprise(OS Build 10.0.22000.100);Graphics card: Intel(R) Iris(R) Xe Graphics, Graphics driver: 30.0.100.9836; Max GFX power set to 155W, GPU Mode set to Integrated; Windows Power Plan is set to Balanced, and Windows Power Mode set to "Best performance"; Windows 11 run with VBS enabled, Tamper Protection enabled and Defender enabled.
Processor: AMD Ryzen 9 5900HX processor, 8C16T; tested on Lenovo Legion R9 5900HX laptop, memory: 2X 16 GB DDR4- 3200MHz; Storage: Samsung PM981a 1TB; Display Resolution: 1920x1080; OS: Microsoft Windows 11 21H2 (OS Build 22000.282); Graphics card: NVIDIA RTX 3080, Graphics driver: 472.19; Max GFX power = 165W, BIOS version GKCN44WW. GPU Mode: Discrete; Power Plan set to Legion Balanced, Legion Quiet (the Lenovo App will overwrite Windows power plan); Power Mode (Win 11 Feature) set to Best Performance; power App Setting (OEM's App) set to Lenovo Vantage set to Balanced Quiet Mode; VBS enabled, Defender enabled, and Tamper Protection enabled.
Processor: Apple M1 Max; 10(8performance +2 efficiency); tested on MacBook Pro 16" Model A2485, Memory: LPDDR5 64GB; Storage Brand: Apple, Storage: Apple SSD SP2048R 2TB; OS: Monterey; OS Version:12.0.1; Kernel Version: Darwin 21.1.0; Graphics: Apple 32 cores integrated GPU; Resolution set to default; Screen Size: 16"; Battery Size: 100-watt-hour lithium-polymer battery; PC BIOS: N/A; GPU Mode: N/A; OS Power Plan: Preferences->Battery->Power Adaptor->energy mode is set to "High Power"; VBS: N/A; Defender: N/A: Tamper Protection: N/A
Measurement
Based on superior performance of 12th Gen Intel Core i9 12900HK against Intel Core i9 11980HK, AMD Ryzen 9 5900HX, and Apple M1 Max. Intel processor performance is estimated based on measurements with Intel Reference Validation Platforms. AMD processor performance is estimated based on measurements on a Lenovo Legion R9000K with RTX 3080. Apple M1 Max performance is estimated based on public statement made by Apple on 10/18/2021 and measurements on Apple M1 Max 16" 64GB RAM Model A2485. Best available compilers selected for all processors. Binaries compiled with ICC for Intel/AMD, binaries compiled withXcode13.1 for Apple. The metric used is the geometric mean of an n-copySPECrate run of the C/C++ integer benchmarks in SPEC CPU 2017. Benchmark: SPEC* CPU2017 is a benchmark from the SPEC consortium (http://www.spec.org) that measures computer performance and throughput using compute intensive application subtests.SPECint*_base2017 provides a comparison point as to how fast a device completes a series of single integer compute tasks.SPECint*_rate_base2017 provides a comparison point for throughput, or how many integer computes tasks a device can accomplish in a given amount of time. TheSPECrate® 2017 Integer andSPECrate® 2017 Floating Point suites measure the throughput or work per unit of time.
简单解释一下,Intel的测试平台是和最新的Macbook Pro 16,型号A2485对比;AMD测试平台是联想R9000K,5900HX+RTX 3080配置。测试内容为SPECint2017 rate-N,选择最佳的编译器编译:Intel和AMD的CPU用ICC(Intel C Compiler),苹果用Xcode 13.1。
以前说M1单核很强,干掉10代i9的,大部分观点来自于Anandtech的SPEC测试结果,以及GreekBench(毕竟SPEC不是谁都买得起玩得转的,一众up主拿视频编辑来说事的就先不提,毕竟M1有视频加速单元,不做视频的用不上)。Intel没有给出GreekBench成绩,本文只讨论SPECint2017。
即使是Anandtech的SPECint2017,12代的单线程性能核也是比M1强的[3]:
实话说,从A社的这个结果看,M1比i9-12900K的P核单线程整数性能差距很小,考虑到i9-12900K的单核主频最高5.2 GHz,M1主频3.2 GHz,12900K的P核平均最高功耗高达30W(按照下图中A社测得得8P 239W计算),35W下6P8E的i9-12900HK必然大幅降频,还能比8大2小的M1 Max强么?
不知道有多少人留意到,A社的SPEC测试和Intel的SPEC测试不同——A社使用LLVM[3],Intel使用ICC:
For compilers, we use LLVM both for C/C++ and Fortan tests, and for Fortran we’re using the Flang compiler. The rationale of using LLVM over GCC is better cross-platform comparisons to platforms that have only have LLVM support and future articles where we’ll investigate this aspect more. We’re not considering closed-sourced compilers such as MSVC or ICC.
clang version 10.0.0
clang version 7.0.1 (ssh://http://git@github.com/flang-compiler/flang-driver.git
24bd54da5c41af04838bbe7b68f830840d47fc03)
-Ofast -fomit-frame-pointer
-march=x86-64
-mtune=core-avx2
-mfma -mavx -mavx2
编辑器不同导致的差异有多大呢?看看A社关于至强8380的测试和SPEC数据库中的差异。A社对至强8380的评测中[4],使用的另一个编译器,GCC 10.2,编译参数-Ofast -march/-mtune=skylake-avx512,双路8380平台的SPECint2017 rate-N成绩是327.8。
而SPEC数据库中,双路至强8380的SPECint2017 rate-N得分[5],最低517,平均550.03。和Anandtech的测试成绩相比,平均成绩高68%。
根据超能网的测试[6],8P8E的i9-12900K关掉两个P核,CPU功耗限制到45W模拟移动平台表现时,性能可以发挥60%左右——不过超能网说的是整体成绩,浮点测试项目因为浮点单元功耗更高所以发挥的少,整数测试项目发挥性能更高。参考上面的几个SPEC得分差距,12代的i9-12900HK在35W下,性能降低到60%;采用ICC再提升68%回来(我不是很确认ICC对比LLVM是否能和对比GCC一样,暂且这么计算吧),性能还高了0.8%,略微胜出M1 Max,并不是什么奇怪的事情。
从架构方面来看,M1 Max虽然工艺更优秀,架构更宽所以IPC更强,内存带宽高的吓人,但在多线程应用中不支持超线程;i9-12900HK除了P核支持超线程,还有8个能耗比高而且性能不弱的E核来拉高多线程成绩。类似SPEC这样的纯CPU性能测试即使限制同等功耗,i9-12900HK胜出也并不奇怪。
这个事居然还需要评价就离谱。移动端如果比多核性能的话x86本来就能随便超M1。M1的强项在单核。
12代多核性能超M1是理所当然的事情,超不过才会是新闻。哪怕是AMD,多核超M1也很轻松。M1从来都不是什么最强处理器,只不过苹果才是这个星球最擅长宣传营销的公司。甚至我为都只能甘拜下风。把某个极品单核性能以及特殊dsp硬件加持的视频性能当做卖点宣传也就苹果能做得出来了。
从 CpuMark 的成绩来看,M1的多核性能只是 5600X 水平,与 i7, R7 有很大差距,这里只需要拿 i5 R5 就能跟 M1 去比了,完全不需要动用 i7 R7,更不用说 i9 R9:
M1的单核性能其实也并不能跟12代酷睿相比。
另外这个图片中橙色的锐龙曲线几乎是平的。。。看起来有没有可能是p上去的?测试5900HX功耗只有25~45范围这合理吗?
如果此图为真,锐龙处理器往低功率方向延展后的线条(向左延展),能耗比将远远超过M1跟酷睿,哪怕不延展,只看图中25W的性能已经远远超过了M1,也就是说这张图可以告诉大家最佳轻薄本处理器是锐龙处理器。这就让人很尴尬了,毕竟,极低功耗性能这方面其实锐龙并不敢跟苹果比的。
我可能要讲一些很多人都难以相信和接受的事实。
Intel这个PPT,不能说错,但是很有误导性。35w这个点,12900(H)K的性能确实是比M1Max高了10% - 15%左右。
但是Intel选35w这个点很有心计。为啥不能选一个远低于35w的点呢?因为12900(H)K单核满载功耗就是35w上下。作为对比,苹果的firestorm核心,单核满载功耗3-4w左右。而二者的单核性能差距,也就是10% - 15%。
因为绝大多数场景是单核轻载、单核重载、多核轻载,所以M1Max基本可以被pin在12900K的九成性能水平上。
而12900(H)K虽然绝大多数场景下性能强过M1Max 10% - 15%,但是这个代价是800%的能耗。
在各种benchmark上平均,M1Max的单核能效比是12900(H)K的8倍左右。远远超过了工艺因素能解释的范围。
我们对12900(H)K是做过功耗差分分析的,12900(H)K单核满载时,光是一级数据缓存这一个部件而已,动态功耗就很容易3-4w了,这一个部件就是苹果那边的单核满载水平。Intel为什么不能拿一个3-4w单核满载的12900(H)K去跟M1Max比?因为这个数据点对Intel来说极难达成,单核3-4w状态下的12900(H)K性能会低到根本没办法看,怕是连基本的用户界面操作响应都出现延迟了。所以,只能用35w的单核,去对比人家3-4w的单核。什么,你说M1Max 35w够开8个大核了?对不起,只能装作没听见。
如果上面这个8倍能效比的差距让你很难接受,下面的你估计更加无法接受。SPEC CPU对比的是纯粹的芯片设计层面的差距,还没有垂直整合的因素在里面。而真实场景会引入苹果最擅长的垂直整合,差距进一步扩大。
在各种真实场景上的平均,M1Max往往能达到10倍,20倍,30倍于12900(H)K的能效比。而这是传统的benchmark跑分压根cover不到的。
例如我们内部的测试里,M1Max对同一个excel表格完成一些固定操作序列,产生的功耗大致在300-500mW量级,平均主频只有1GHz出头。而12900(H)K对同一个excel表格完成一些相同固定操作序列,产生的功耗是8-9w量级,平均主频3.5GHz。
这背后的原因除了DVFS以外,跟大小核也有很大关系。核心场景中M1Max的小核会有承担不低比例的工作量,像上面这个办公场景一般是30%工作放在小核上,M1Max小核承担这个部分的工作时,功耗只有45mW。而Intel这边,自己的小核的功耗(满载15w左右),甚至比M1Max的大核功耗还要高几倍,offload过去以后总体功耗仍然远高于M1Max。
像这样的核心场景,产生如此大的功耗差别,对笔记本续航的影响是致命的。
因为航空业的限制,笔记本电池最大容量只能99Wh。
那么5w - 10w的屏幕 + 一个8-9w功耗的Intel CPU核心的windoes笔记本,决定了移动办公场景下的续航上限就是5h - 7.5h左右。而MacBookPro这边,因为面对这种核心场景时CPU功耗低到可以忽略,续航可以做到14h左右。
Intel这个PPT上公布的指标是基于SPECrate,版面上很多人说SPECrate,这个东西其实参考价值不高。
消费级的CPU是为了绝大多数人的通用场景做的CPU,不是为了跟服务器CPU拼重载多核吞吐而做的。消费级CPU最看重的是单核重载(特别是短时爆发性能,直接影响app启动和用户界面交互体验),单核轻载 + 多核轻载场景(邮件,办公,网页浏览等),绝大多数流行应用都归类到这里,至于那些benchmark测试的各种多核重载,一个是占比低,一个是性能/功耗profiling看到的情况跟真实负载差别比较大,所以参考意义有限。
所以在设计的时候,面对单核 vs 多核的各种权衡取舍,大部分时候会偏向单核。比如说,prefetcher设计的调优(这玩意儿会影响20%的单核性能),面向多核设计的prefetcher势必会冲击单核性能,所以至少我们自己的设计,整体就会偏向单核来做,把单核性能优先考虑,或者做单核多核两套方案,根据系统负载自动切换,但多核的优先级不会很高。所以版面上大家拼命在争论的各种多核重载场景,其实设计的时候就注定了不那么在乎。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有