首页 > 消费 > 正文
Qzone
微博
微信

不用小核也很猛,第12代酷睿Alder Lake-S同频性能测试

太平洋电脑网    2021-11-07 17:22

经过漫长的等待,英特尔在2021年底正式推出了第12代酷睿处理器AlderLake-S桌面版。AlderLake-S是英特尔首批大规模量产的10nm桌面版处理器,此前称之为10nmEnhancedSuperFin(现在重命名为Intel7,和业内的节点标准相匹配),这对英特尔来说意义重大,标志着其在轻薄本、游戏本、服务器、台式机等所有产品线都完成了工艺制程与微架构的全面换代,14nm和Skylake两位老朋友将彻底告别舞台......

除了工艺制程的换代之外,AlderLake-S运用了众多新技术、支持很多新标准,最明显的特性就是采用了Hybrid混合架构设计,性能核也就是P-Core采用了GoldenCove微架构,能效核E-Core则是Gracemont,最多高规格为8+8核心/24线程。此外对DDR5内存以及PCIe5.0协议的支持,则标志着AlderLake-S平台整体的全面升级。

首批上市的AlderLake-S高端产品均应用了Hybrid混合架构设计,也就是搭配了4到8个E-Core能效核,英特尔表示新一代能小核Gracemont旨在面对当今多任务场景做到充分优化,提高了吞吐量效率并提供可扩展的多线程性能。观察dieshot可以发现,4个Gracemont和1个GoldenCove大小相当,都占用了1个Ring节点,但4个Gracemont组成集群后多线程性能会比1个GoldenCove开启超线程之后更强,因此PPA角度上来看,Gracemont显然比GoldenCove要好得多,能在有限的硅片空间内实现更强的多核任务负载。

AlderLake-S采用Hybrid混合架构设计则是兼顾了GoldenCove与Gracemont二者的共同有点,致力于做到单线程与多线程两个维度的全面提升。不过Hybrid混合架构设计和ARM的big.LITTLE相似,都需要软硬件的合理调度优化才能让性能最好发挥。为此AlderLake-S内置了英特尔硬件线程调度器ITD来进行引导,并针对最新Windows11操作系统进行优化设计,致力于在合适时间将恰当的线程置于相应的内核上,从而确保这两种全新内核微架构的无缝衔接。

不过对于很多用户,尤其是游戏玩家来说,他们更关注AlderLake-S中性能核GoldenCove的表现,能小核Gracemont带来的多线程性能提升则是起到锦上添花的作用;甚至很多玩家还准备关闭能效核,在有限的功率和散热能力下将性能核超到更高的频率。PConline评测室针对第12代酷睿处理器AlderLake-S,除了综合性的首发评测之外,还针对性能核GoldenCove进行了单独测试。

英特尔10nm与新架构的曲折之路

在性能测试开始前,我们先来简单回顾一下历史,英特尔在2014年(Tick年)底成功量产了14nm工艺制程,推出Broadwell家族的酷睿M系列产品,而在2015年(Tock年),Intel则利用良率逐步走向成熟的14nm工艺制程将Skylake微架构的第6代酷睿全面推向市场;而那几年AMD还在推土机泥潭中挣扎,Skylake甚至Haswell都能够做到酷睿i3默秒全......

根据早期的路线图,如果英特尔能够持续延续Tick-Tock节奏,那么会在2016年(Tick年)量产10nm制程工艺的CannonLake(微架构继承Skylake),在2017年(Tock年)进行下一轮微架构升级,将IceLake推向市场......

不过在当时,没人能预测到原定计划服役2-3年的Skylake微架构会在桌面平台被使用长达5年之久,由于10nm工艺制程的种种问题,且英特尔所遵循的“工艺制程与微架构相捆绑“原则,英特尔迟迟不能将新架构的产品推向桌面市场,第7代酷睿KabyLake-S、第8-9代酷睿CoffeeLake-S乃至第10代酷睿CometLake-S等一系列产品,虽然都有新的CodeName,但本质却都是Skylake微架构的马甲,内核IPC没有变化,主要是依靠增加核心线程数量,以及拉高核心睿频来获得性能提升。2021年初,面对AMDZen3的凌厉攻势,英特尔终于有所动作,将原本基于10nm节点设计SunnyCove微架构backport“反向移植”到14nm节点上进行生产,这就是代号为RocketLake-S的第11代酷睿处理器桌面版。

不过客观来说RocketLake-S并不是一代很成功的产品,将为10nm节点设计的微架构反向移植到14nm节点上,势必会产生很多新问题。CypressCove微架构为了提高IPC,每核心的规模也就是晶体管数量相比Skylake微架构做到了显著增加,而采用低密度的14nm节点来生产,势必导致面积及功耗的增长。最终酷睿i9-11900K只有8核心16线程,芯片面积却比10核心20线程的酷睿i9-10900K还要更大,且满载功耗变得更高了.......

虽然在桌面平台长期停滞于14nm节点,但英特尔近年来的微架构设计还是做到了稳步推进。在2020年后,英特尔推出的TigerLake系列第11代酷睿处理器移动版采用了WillowCove微架构,WillowCove相当于SunnyCove的小幅增强版,改进了缓存设计,每核心拥有更大容量的L2和L3缓存(IPC对比SunnyCove提升只有个位数,几乎可以忽略不计),并在10nmSuperFin技术的加持下频率大幅提升。而本篇文章的主角,第12代酷睿AlderLake-S采用性能核GoldenCove则是WillowCove的下一代升级版。

新一代性能核GoldenCove简介

前文提到过,AlderLake采用的P-Core性能核代号为GoldenCove,但不同于WillowCove对SunnyCove微调缓存式的小幅升级,GoldenCove是称得上Tock级别升级的全新微架构,整体的变化非常大,官方宣传称GoldenCove的设计目标旨在提高速度,突破低时延和单线程应用程序性能的限制,以及更好地支持代码体积较大的应用程序。

为了进一步提高IPC,GoldenCove的设计宗旨是更宽、更深、更智能。微架构的前端解码器由4个增至6个,6µop缓存增至8µop。

ROB乱序重排缓冲区部分,GoldenCove则达到了恐怖的512队列,相比于SunnyCove和WillowCove的352队列增加40%以上,是AMDZen3架构的2倍,仅次于苹果M1大核心Firestorm的630队列。

wideallocation分配由5路增至6路,执行端口由10个增至12个。具体到整数执行引擎部分,GoldenCove增加了第五个整数执行端口。

矢量浮点执行部分,虽然没有增加端口,但额外添加了新的FADD加法计算单元。

二级缓存部分,GoldenCove可配置每核心1.25MB或每核心2MB,其中面向消费级的AlderLake-S为每核心1.25MB,这一点与第11代酷睿TigerLake的WillowCove相同。至于面向数据中心领域的SapphireRapids,则配备每核心2MB二级缓存。

具体的性能方面,英特尔表示AlderLake的性能核GoldenCove是公司有史以来最为强大的x86内核微架构,对比第11代酷睿处理器桌面版RocketLake的CypressCove,两者运行在相同的3.3GHz频率上,测试SPECCPU2017、SYSmark25、Crossmark、PCMark10,、WebXPRT3、Geekbench5.4.1等项目,GoldenCove的平均IPC提升可达19%。

考虑到CypressCove对比Skylake已经有了超过两成的IPC提升,而GoldenCove在CypressCove的基础上又提升了19%的IPC,可以称得上百尺竿头更进一步!当然对于测试处理器微架构的IPC及提升幅度,变量其实不小,采用不同的测试平台(主板BIOS版本、内存频率和时序、缓存频率、操作系统),测试不同的应用项目,都会对测试结果产生显著的影响。

测试平台简介

测试平台方面,AlderLake-S选用了旗舰型号酷睿i9-12900K,搭配ROGMAXIMUSZ690EXTREME主板与金士顿金士顿FURY16G×2DDR5-5200CL40内存。参与对比的是RocketLake-S和CometLake-S平台的旗舰型号,酷睿i9-11900K和酷睿i9-10900K,这两个平台的内存使用宏�掠夺者PREDATOR16G×2DDR4-3600CL16。测试系统为Windows11专业版。

比较遗憾的是,由于时间紧张,本次同频测试没有加入游戏性能的同频率对比;关注AlderLake-S游戏表现的玩家,可以关注PConline的综合性首发评测。

通过BIOS将酷睿i9-12900K的所有E-Core能效核关闭,只保留8个性能核,最终规格为8核心16线程,和酷睿i9-11900K相同;酷睿i9-10900K则关闭两个核心,也是保留8核心16线程。为了避免睿频调度的影响,三款处理器均锁频为全核心4.5GHz,Ring也就是缓存频率也锁定为4.3GHz。

ROGMAXIMUSZ690EXTREME是华硕ROG家族推出的旗舰级产品,外观炫酷、用料豪华,堪称是第12代酷睿AlderLake-S的最强座驾。

ROGMAXIMUSZ690EXTREME的BIOS界面和前几代产品基本相同,功能也是非常丰富的。测试前将XMP打开,内存频率为5200CL40-40-40-80,比JEDEC标准要略高一点;由于金士顿FURY16G×2DDR5-5200CL40是首批DDR5内存,因此它的频率并不是特别高,时序也不是很好看,希望明年DDR5逐步走向成熟后,出现频率更高时序更低的产品。

另外在额外提一下,在ROGMAXIMUSZ690EXTREME主板的现有0702版BIOS中,当关闭所有E-Core能效核后,8个P-Core性能核是可以手动打开AVX-512的。就是不知道后续的版本BIOS会对AVX-512做出怎样的处理,有可能会直接屏蔽掉?而到了明年,像酷睿i5-12400这样的纯性能核产品正式发布后,又该如何处理AVX-512呢?我们将持续关注......

纯性能模式下CPU-Z软件所识别的参数,分别是关闭AVX-512与开启AVX-512。

同频测试对比——这次牙膏真的是挤爆了

本次测试包含众多项目,基本覆盖了常见的基准测试工具,包括CinebenchR20、CinebenchR23、V-Ray4、V-Ray5、Blender2.93.5、POV-Ray3.7.1、Keyshot、Corona1.3、CPU-Z、y-cruncher、SisoftwareSandra2021、PCMark10、3DMark、ULProcyon、Crossmark等等。未来将加入更多测试项目,并与AMDZen3微架构的锐龙5000系列桌面处理器Vermeer做更详细的同频性能对比。

先来看一下常见的Cinebench,作为基于Cinema4D开发的测试软件,Cinebench阴恻测试简单直观而广泛流行,目前已经跟随Cinema4D一起更新至R23版本。此前Cinebench是英特尔处理器的弱势项目,不但核心数量要比对位的AMD竞品少很多,并且同频性能也不占优势。

而到了第12代酷睿AlderLake-S,针对Cinebench的同频性能有了很大的提升,实测在R20及R23版本中,GoldenCove对比第11代酷睿RocketLake-S的CypressCove单线程有超过22%的提升,多线程则超过25%,比官方宣布的IPC提升平均值19%还要高出几个百分点;而如果对比Skylake微架构,GoldenCove在R20和R23这两项做到了单线程提高超过40%,多线程提升超过50%,这个幅度非常恐怖!

CPU-Z同样是流行的基准测试软件,包含不同的项目以分别调用处理器的不同指令集运行,测试时采用1.97版本。GoldenCove对比CypressCove的同频性能提升也超过20%,高于CypressCove对Skylake的提升幅度。

V-Ray是由专业的渲染器开发公司CHAOSGROUP开发的渲染软件,是业界最受欢迎的渲染引擎。本次测试的是V-Ray4和V-Ray5两个版本的独立benchmark,显示GoldenCove对比CypressCove的同频性能提升都超过了22%。

POV-Ray,全名是PersistenceofVisionRaytracer,是一个使用光线跟踪绘制三维图像的开放源代码免费软件,在GitHub上面下载3.7.1版本进行测试。此前CypressCove对比Skylake在这个项目中的同频提升只有12-13%,而本次测试GoldenCove对CypressCove在本项目的同频提升则高达24%以上。

Blender是一款开源的跨平台全能三维动画制作软件,提供从建模、动画、材质、渲染、到音频处理、视频剪辑等一系列动画短片制作解决方案,目前最新版本为2.93.5,导入Classroom素材进行渲染,记录消耗时常。这项GoldenCove对比CypressCove同频提升也超过了20%。

KeyShot意为“TheKeytoAmazingShots”,是一个互动性的光线追踪与全域光渲染程序,无需复杂的设定即可产生相片般真实的3D渲染影像。目前也推出了独立的测试工具KeyShotViewerBenchmark,这项GoldenCove对比CypressCove同频提升同样超过了20%。

CoronaRender渲染器是业界后起之秀,在渲染质量和速度上其实非常优秀,目前提供了Corona1.3Benchmark基准测试程序。GoldenCove在这项测试中表现一般,同频对比CypressCove提升只有11%左右。

使用3DMark对处理器进行测试,首先是FireStrike、TimeSpy和TimeSpyExtreme三个项目中的物理分数。GoldenCove对比CypressCove,在TimeSpy和TimeSpyExtreme两项的同频提升幅度在12-13%左右,FireStrike项目提升为21%。

CPUProfile是3DMark新版推出的处理器性能测试项目,可测试处理器不同线程负载下的性能表现。此前CypressCove对比Skylake在CPUProfile场景中表现出色,不过GoldenCove在却在此项目中提升较为有限。

PCMark10含有一整套全面的测试项,涵盖现代办公场所中的各种任务,是被广泛认可的计算机综合性能测试软件,除了处理器以外,内存、显卡、固态硬盘性能也会影响分数。运行PCMark应用程序测试项目(Office+Edge),GoldenCove对比CypressCove同频提升超过17%。

ULProcyon是为专业用户打造的基准测试组件,目前推出了办公室生产力基准测试项目,使用微软Office应用程序来衡量电脑的办公生产力工作性能。该基准测试的特点是使用微软Word、Excel、PowerPoint和Outlook模拟真实的任务。GoldenCove对比CypressCove在此项目中同频提升超过18%。

Crossmark是BAPCo组织开发的基准测试软件,覆盖创造力、生产力和响应速度三大维度,对处理器的单线程性能有很高要求。此项测试中GoldenCove对CypressCove的同频提升达到15%。

y-cruncher是一款计算圆周率的软件,能够较好的利用AVX-512指令集及其拓展,同时也对内存的带宽提出很高要求。得益于DDR5内存更高的带宽,即便不开启AVX-512,只是用AVX2的执行文件,GoldenCove的多线程计算效率也会更强。当然,如果BIOS里选择开启AVX-512,提升还会更加显著。

SisoftwareSandra2021版同样对AVX-512指令集做了很多优化,因此当时测试第11代酷睿RocketLake-S时,CypressCove对Skylake做到了超过40%的提升。而对于AlderLake-S来说,在这项测试中,性能核GoldenCove即便不开启AVX-512也能和CypressCove开启AVX-512打成平手,BIOS关闭能效核、手动开启AVX-512后则做到了进一步提升。

写在最后——总结与展望

汇总本次的测试项目成绩,第12代酷睿AlderLake-S的性能核GoldenCove对比第11代酷睿RocketLake-S采用的CypressCove,在绝大多数应用场景中都有很明显的性能提升(平均提升达到18.2%),特别是像Cinebench、V-Ray、Blender、POV-Ray等多线程渲染项目,GoldenCove的同频提升都达到了20-25%,进化幅度幅度比CypressCove对Skylake还要大一些。另外,与AMDZen3的同频测试数据对比正在汇总......

如果跨度更大一些,与当前英特尔桌面平台处理器中存量最高的Skylake微架构去对比,GoldenCove在以上这些常用基准测试中可以获得30-50%的同频性能提升。因此对于使用第8代-第10代酷睿的用户来说,即便完全不考虑能效核Gracemont,只看性能核GoldenCove的IPC表现,第12代酷睿处理器AlderLake-S的升级幅度依旧是巨大的。

在2021年,历经磨难的10nm工艺制程在良率和产能方面逐渐走上正规,同时频率也能做到了5.0GHz以上,不再是拖后腿的存在,能够在各个产品线完成对14nm的全面取代。而微架构方面经过了Skylake到CypressCove再到GoldenCove的两次进化,IPC效率提升显著,彻底摆脱了“高频低能”的尴尬境况。再结合Gracemont能效核带来的多线程提升,以及DDR5、PCIe5.0等新特性,第12代酷睿处理器桌面版AlderLake-S可以称得上一次全面的换代升级。

在帕特·基辛格回归后,英特尔提出了非常激进的路线图规划,我们也期待英特尔能够加快产品开发进度,让未来新品的微架构设计和工艺制程都获得持续更新,不要让2015-2020年期间祖传14nmSkylake的历史再一次上演......

作者:钻石湾

 

责任编辑: 3976DBC

责任编辑: 3976DBC
人家也是有底线的啦~
广告
Copyright © 2018 TOM.COM Corporation, All Rights Reserved 雷霆万钧版权声明
违法信息/未成年人举报:010-85181169     举报邮箱/未成年人举报:jubao@tomonline-inc.com