前言
英特尔于3月16日正式发布第11代桌面级酷睿处理器,核心代号“RocketLake-S”,采用全新的“CypressCove”架构,是继SkyLake架构后首个全新架构设计,主打游戏性能的再次提升,拥有最大19%的IPC性能提升与50%的核显图形性能提升,并首次在桌面级处理器中支持英特尔的AIDeepLearningBoost深度学习技术和AVX拓展指令集。
英特尔一次性公布了11代酷睿所有处理器的型号、规格以及售价情况,我们挑一部分重点内容来说。11代酷睿处理器最大核心数为8核16线程,i9和i7均为8核心规格,和以往i7对应8核,i9对应10核的分级不同。这代i9和i7只有频率区别,iK基础频率3.5Ghz、最大加速频率5.3GHz,iK基础频率3.6GHz,最大加速频率5GHz。相同的部分在于11代酷睿依然有不带核显的11X00、11X00F以及11X00KF的带核显锁倍频处理器、不带核显锁倍频处理器以及不带核显不锁倍频处理器。
售价上iK售价元,不带核显的iKF售价元;iK售价元,不带核显的iKF售价元,不带核显不支持超频的iF售价元;6核12线程的iK售价元
11代酷睿架构分析
第11代酷睿处理器采用了全新的“CypressCove”架构,如果按照之前的摩尔Tick-Tock规律,这是继SkyLake架构之后的Tock架构级升级。“CypressCove”架构严格意义上可以算作SunnyCove架构的移植版本,将架构从10nm移植到14nm上,重新设计硅晶的信号传输、数据路径、逻辑缓存块,甚至为了实现在密度更小工艺上的信号完整性,还得额外设计更长的流水线周期,难度也是非常高的。
CypressCove架构对比SkyLake架构比较明显的提升是增大了L1数据缓存和L2缓存容量,L1数据缓存从每核心32KB提升至48KB,缓存数据关联性从8路提升至12路,L2缓存从每核心KB提升至KB,缓存数据关联性从4路提升至8路,相较前代有了翻倍提升。
架构层面,前端强化了分支预测功能,分支预测器和预取器更为先进,前端OP缓存从每OP1.5K条目提升至2.25K,指令地址映射页目也从8个提升至16个,指令解码队列从64个增加到70个。后端和执行单元提升了ReorderBuffer重排序区的条目数,从个条目增加到个条目,调度器条目从97个提升至个,并且增加了新的数据路径,存储AGU单元从1个提升为2个,并用2个装载AGU单元替换了通用单元。内存控制器也采用了全新设计,支持DDRMHz频率内存。总得来说CypressCove架构相对SkyLake架构提高了并行性,增加了缓存大小和接口数据吞吐量,并最终实现了19%的IPC性能提升。
第11代酷睿处理器引入了最新的Xe架构核显-UHD,英特尔对Xe架构的定位是“并行矢量矩阵架构”,突出其高度拓展性和并行运算,除了核显还会运用于独显、云端计算等应用场景。Xe架构对SIMD单元进行了重新设计,每个EU单元里的运算单元的宽度翻倍达到8-wide,还增加了2-wide的特殊运算单元,用于特殊函数运算。集成在11代酷睿处理器中的UHD最大配备32个EU单元,相对前代核显,图形性能提升50%。
UHD多媒体的部分还支持10-bitAV1、12-bitHEVC(H.)编码、E2E压缩功能,显示输出部分支持HDMI2.0和DPHBR3。
其他部分,第11代酷睿处理器引入PCIe4.0接口,支持共计20条PCIe4.0通道,其中16条用于支持显卡,4条用于支持PCIe4.0x4M.2硬盘接口,并支持ResizableBAR功能。
英特尔在第10代酷睿处理器中引入了TVB(ThermalVelocityBoost)睿频技术,支持更智能和更高的睿频频率。在第11代处理器的i9酷睿处理器中,英特尔再度新增了更先进的ABT(AdaptiveBoostTechnology)睿频技术。和过去的睿频技术一样,英特尔ABT睿频技术依然在规范内运行,不算是额外超频,享受英特尔的售后支持。
英特尔ABT睿频技术可在度的温度上限范围内进行睿频加速,范围比TVB睿频技术的70度更高,同时对于i9处理器的单核和全核频率均有提升,全核睿频最大可达5.1GHz,单核睿频最大可达5.3GHz。
注:ABT睿频技术仅支持iK和iKF处理器,并且需要在BIOS中手动开启。
Z芯片组与主板介绍
第11代酷睿处理器在超频功能上继续进行优化,除了刚刚提到的ABT睿频技术和H和H开放内存超频功能,还增加了AVX和AVX2指令集的频率和电压调整功能和开关功能,将更先进的AVX指令集控制权交给了玩家选择。
第11代酷睿处理器依然采用LGA接口,适配系列芯片组,兼容Z芯片组主板主板。Z芯片组最亮眼的提升莫过于万年不变的DMI接口终于翻倍提升至DMIGen3x8速率,原生支持USB3.2Gen2xGbps接口,相对之前的USB3.2GenGbps接口也是翻倍提升,并集成CNViWi-Fi6功能和支持独立雷电4(需额外芯片)接口。在入门级的B和H芯片组,现已开放内存超频功能,在B主板上将可以使用XMP高频内存。
本次测试提供的是华硕ROGM13H主板。
ROGM13H定位高端,搭载Z芯片组,采用14+2相供电设计,支持PCIe4.0接口和4组M.2插槽,在供电部分和M.2接口以及PCH芯片组部分均有厚重的散热片设计,保证了超频和高端M.2固态硬盘的稳定。外部接口支持Wi-Fi.1ax无线网卡和双2.5Gbps有线网卡,更额外支持了最新的雷电4接口,规格可谓豪华。
ROGM13H的背部接口有BIOS刷新按钮、CMOSClear按钮、2个USB2.0接口(黑色)用于支持键鼠以及刷新BIOS,1个HDMI2.0视频输出接口,支持4K分辨率60Hz,黄色的Wi-Fi6无线天线接口,旁边是惊人的6个3.2GenGbps接口以及2个USB3.2Gen2xGbps接口/雷电4接口,需要说明的是雷电4接口和USB3.2Gen2xGbps接口在物理层面完全一致,具体速率和标准取决于芯片以及处理器/芯片组的支持。在Z和11代酷睿处理器中并无内置雷电4控制器,所以M13H需要额外的雷电4专用芯片才能支持2个雷电4接口,规格十分豪华,再旁边的就是2个RJ.5Gbps网络接口和音频接口。
我们手上还有一张是技嘉的高端主板ZAORUSPROAX主板,也进行了测试。
技嘉ZAORUSPROAX是上代热门产品ZAORUSPROAX的升级款,搭载Z芯片组,采用12+1相直出式供电,用料扎实,支持PCIe4.0接口,拥有4个M.2插槽,支持.1axWiFi6无线网卡和2.5G有线网卡,作为一张中高端主板,AORUSPRO的配置可以说是非常全面。
ZAORUSPROAX主板的I/O接口也是十分丰富,拥有4个USB3.0接口(蓝色)和4个USB2.0接口(黑色),旁边是Wi-Fi天线接口以及DP1.2视频输出接口,最大支持4K分辨率60Hz,红色的是4个USB3.2GenGbps接口,TypeC接口则是支持USB3.2Gen2x2的20Gbps接口,再旁边是RJ.5Gbps网络接口以及音频接口。
更多主板测试会在之后陆续进行。
处理器开箱与图赏
第11代酷睿处理器的评测包外包装增加了更多的立体元素,契合英特尔的新品牌商标,增添了更具活力的元素。我们拿到的测试样品和上代相同,分别是iK和iK,分别代表了旗舰级和产品和主流级产品。
11代酷睿零售版外包装设计有所不同,i7和i5是常规的“方盒”设计,封面契合英特尔的新品牌商标设计风格,i9则采用了非常特别的波浪状水晶设计,与前两代的K和K有异曲同工之处。
再来近距离看看iK的外包装设计。
i9-K和上代i9-K相比,可以看到i9-K的顶盖明显更长,这可能是因为K更换了处理器架构并增加了全新的Xe核心,使得核心Die拉长的缘故。顶盖工艺似乎也略有不同,颜色显得更为深邃,同时产品信息刻印的清晰度也更高。
第10代酷睿处理器和第11代酷睿处理器采用相同的LGA接口,并保持了一定的相互兼容性,所以背部的金属触点和防呆接口都完全相同,唯有SMT电容有很大区别,这也从侧面说明了两代处理器的架构差异。
测试平台及CPU-Z识别信息
11代酷睿处理器测试平台
处理器:intelCoreiK、iK
主板:ASUSROGMAXIMUSXIIIHERO、GigabyteZAORUSPROAX
内存:HyperXPredatorDDRMHz18-22-22
显卡:GigabyteRXXTGAMINGOC、RXXTGAMINGOC
硬盘:OCZ-TRIONG/UNICPTB
散热器:NZXTKRAKENZ73、ROGSTRIXLCIIARGB
电源:EnermaxRevolution85+W
10代酷睿处理器测试平台
处理器:intelCorei9K、iK
主板:ASUSROGMAXIMUSXIIIHERO、GigabyteZAORUSPROAX
内存:HyperXPredatorDDRMHz18-22-22
显卡:GigabyteRXXTGAMINGOC、RXXTGAMINGOC
硬盘:OCZ-TRIONG/UNICPTB
散热器:NZXTKRAKENZ73、ROGSTRIXLCIIARGB
电源:EnermaxRevolution85+W6
锐龙0处理器测试平台
处理器:AMDRyzenX
主板:ASUSROGCrosshairVIIIDarkHero
内存:HyperXPredatorDDRMHz18-22-22
显卡:GigabyteRXXTGAMINGOC、RXXTGAMINGOC
硬盘:OCZ-TRIONG/UNICPTB
散热器:NZXTKRAKENZ73、ROGSTRIXLCIIARGB
电源:EnermaxRevolution85+W
基准性能测试
11代酷睿处理器的评测,我们选择了上代的i9K、iK和锐龙7X处理器来进行对比,首先我们先看一下10代酷睿处理器和11代酷睿处理器的基准性能成绩。
横跨两代架构的评测,通常我们都能得到非常有趣的测试结果,英特尔11代酷睿也不例外。通过简单的基准性能测试,我们就能对11代酷睿的架构特性有一个大概的画像。首先看到SuperPi部分,SuperPi部分对于处理器的单核效能和主频非常敏感,iK单核睿频最高能达到5.3GHz,10K单核睿频最高能达到4.9GHz,加上CypressCove架构对于缓存性能上的提升,11代酷睿在SuperPi这一项成绩上比10代酷睿高出20%左右,基本达到英特尔官宣的19%IPC性能提升。3DMarkFSCPU这部分的成绩更显有趣,因为iK的核心数比i9K少2个,但单核性能更强,所以K比K仅获得了2%的性能提升,但同为6核心12线程的10K比K成绩高出26%之多,证明了CypressCove架构的优越性。7Zip以及CPU-Z的测试和3DMark的情况差不多,但是7Zip同时还对内存性能敏感,iK跑在DDRMHzGear2模式上对于延迟带来了一定影响,少2个核心加上内存延迟上的影响使得K跑出来的成绩比K略低5%,而10K在相同核心数的对比基础上,以更强的核心性能打赢了K,带来了15%的性能提升。
内存与缓存的部分,第11代酷睿处理器采用了全新的内存控制器,在相同内存设定下,带宽提升5%-10%左右,但因为内存频率跑在DDRMHz上,进入Gear2模式的1:2分频模式,内存延迟增加15%-20%。L1缓存性能因为11代酷睿从每核32KB提升至48KB,并且缓存关联性提升至12路,因此性能也有提升。K的L1缓存带宽提升幅度在55%左右,10K的L1缓存带宽提升幅度达到了%以上,相较K是翻倍的带宽提升。
CinbenchR15、R20、R23的测试情况基本相同,我们就合在一起说了。10K相较K在Cinbench测试中,多线程成绩提升幅度达到30%左右,单线程提升幅度达到20%,可以说这是来自于架构层面最直观的性能提升幅度。但是iK因为核心数相较K少2个,所以仅仅单线程成绩拿到20%左右的性能提升,多线程成绩提升幅度在1%-2%,非常可惜。如果K能维持相同核心数升级,提升幅度将非常可观。
功耗部分,我们用了CinbenchR20和Prime95两个软件来进行测试。CinbenchR20代表了典型高负载测试,K相较K,功耗提高13%,10K相较K,功耗提高69%,显然造成这个差值的原因也是核心数与架构的关系。Prime95代表的是非典型的极限负载测试,因为Prime95支持AVX指令集关系,K在AVX指令集和ABT技术的双重压力下,频率下降幅度较大,因此功耗反而没有K高,降低了28%,而10K不支持ABT技术,PL2功耗空间余量相对富余,所以跑出来的功耗水平与Cinbench20差不多,功耗相对K提升13%。
酷睿iK与锐龙7X对比,SuperPi的部分和10代酷睿的测试情况类似,频率更高的K又夺回了在SuperPi测试下的优势,SuperPi1M跑进了6秒23,SuperPi32M跑进了秒。多线程部分,从目前的测试成绩看,两者的多线程性能表现是相近的,iK主频更有优势,而XL3缓存更大,加上FCLK能跑在同步模式,因此两颗处理器的优势各有不同。iK跑Cinbench、CPU-Z更有优势,Ryzen7X跑3DMark、7-Zip更有优势,XFHDBenchmark则基本相同,单线程性能上,iK凭借着更高的主频,基本是全胜。功耗方面,iK比锐龙7X高出不少,大概是30%-50%的水平。
UHD核显性能测试
第11代酷睿处理器iK、K、10K均配备UHD核显,UHD核显采用全新的Xe架构核显设计,拥有32个EU单元,目前GPU-Z尚无法识别UHD规格信息。
在最新版本的AIDA64中,我们找到了UHD核显的更详细信息。UHD核心频率MHz,拥有32个EU单元个流处理器。
对UHD的核显性能测试,我们先来跑一个3DMarkNightRaid,这个测试项目是专门针对入门级显卡和核显设计。UHD核显图形分,相较UHD的分,性能提升53%,达到英特尔宣称的50%图形性能提升。
接下来是坦克世界ENCORE-RT的光追基准性能测试,画质设定中等,xP分辨率。
在坦克世界中,UHD的图形性能比UHD高出20%。以中等画质、P分辨率运行坦克世界,UHD能提供较好的画面流畅度。
“绝地求生”这个游戏虽然算是一个电竞游戏,但其对配置的要求一点也不低。我们采用xP分辨率,“非常低”画质设定进行测试。
我们用绝地求生的录像回放功能进行测试,选取其中相同的5分钟测试场景,使用Afterburner录制平均帧数。UHD平均帧数是22帧,UHD只有10帧,如果计算提升幅度,这是%的性能提升,达到翻倍的帧数提升,但22帧始终是不太流畅的游戏体验,用核显吃鸡,压力还是比较勉强的。
LOL英雄联盟应该是核显玩家最常玩到的游戏之一,也是热门的电竞游戏之一。我们采用x分辨率、非常高画质设定。使用回放功能,选取正常比赛后半段的5分钟录像场景,录制平均帧数进行性能测试。在LOL中,UHD平均帧数在.3帧,比UHD的.9帧,性能高出15%。
游戏性能测试
游戏的测试我们分为电竞/网游和单机游戏两个部分来进行测试,首先我们来看一下单机游戏的部分。
首先是《全面战争:三国》,作为一款策略类战争游戏,AI单位极多,对于处理器的多线程优化较好。在全战三国中,性能表现最好的是iK,第二位是iK,然后是锐龙7X,最后是10代酷睿处理器。凭借着更高的睿频频率以及更优异的架构性能,11代酷睿处理器在《全面战争:三国》中表现出了更强的游戏性能。
《战争机器5》是一款第一人称的FPS单机游戏,这款游戏对于核心数和核心频率比较敏感,是对处理器利用率较高的游戏。在《战争机器5》中,性能表现最好的是i9K,然后是iK、iK、i以及锐龙7X。在实际测试中,我们观察到游戏对于处理器的利用率只能达到8核16线程,但负载较为分散,这可能是i9K成绩较高的原因,其次就是对频率比较敏感,iK的高频率让其跑到第二名的位置,不过除了i9K跑出的平均帧特别高,其他几颗处理器的平均帧数差距并不大,只有4%-5%左右。
《地平线:零之曙光》是一款从PS4平台移植到PC平台的3A大作游戏,获得的奖项之多数都数不过来。这款游戏深刻诠释了什么叫“众生平等”,5颗处理器跑出的成绩差异基本在3帧左右,1%的性能差距,忽略不计。
《古墓丽影:暗影》是老牌的DXA大作级动作类单机游戏,在这款游戏中,锐龙7X跑出的帧数最高,然后是i9K、iK以及iK和iK,从跑分成绩看,11代酷睿成绩明显较低,比之10代酷睿都略低一些。
《坦克世界》是一款以坦克竞技为主的战争游戏,并在去年推出了ENCORE-RT的光追基准测试软件。从这款游戏的基准测试成绩,我们可以看到这几颗处理器的性能差异并不大,分数只有大约3%的性能差距。
《绝地求生》大家俗称为“吃鸡”,因其特殊的大逃杀竞技模式而风靡全球。AMD在Zen2架构和Zen3架构连续两代处理器对这款游戏进行优化,X的游戏成绩表现可想而知是十分突出的,但是11代酷睿在这款游戏的性能表现略显偏低,比之10代酷睿也差一点,K和10K比之K和K分别差了6%和3%。
《英雄联盟》是风靡世界的电竞游戏之一,11代酷睿处理器在这款游戏的性能表现出现了比较明显的滑坡,K和10K比之10代酷睿成绩差了大约16%和6%,相较X的成绩更是差距明显,这可能与LOL对处理器优化不够有关。
生产力性能测试
人人皆up主的时代,PS、PR是一项常见技能,选择合适的生产力工具是用户在装机时会考虑的问题,所以这方面性能测试是评测不可或缺的环节。
因为我们手头上有多张RXXT显卡,而生产力性能测试每一项都要耗费1小时以上的时间,为了加快评测效率,我们用RXXT显卡来替换RXXT显卡,这样可以同时运行多个平台。
测试均使用PugetSystem提供的Benchmark脚本。PhotoShop对于多核心性能并不敏感,更依赖于单核心性能,iK以较小的优势跑赢了X,同时单核性能更好的10K也跑赢了核心更多的K,如果平时修图应用居多的玩家,不妨考虑iK这样的6核处理器,会更有性价比。
PremierePro是主流的视频剪辑工具,对于多核心和内存性能更为依赖。这个部分,核心更多的K和架构性能更强的K拿到了同分,X的Zen3架构缓存更大,在跑这类测试时更有优势一些,所以X性能还要略高一些。核心数相同的10K比K跑分高出13%,证明CypressCove架构对于视频流应用也有显著的性能提升。
AE是制作动画特效的工具,对多核心、单核心以及主频似乎都比较敏感,从测试结果看,i9K相对iK有明显的性能提升。同时,采用CypressCove的iK、iK以及Zen3架构的锐龙7X也有明显的性能优势,其中主频更高的iK性能比锐龙7X高出8.5%,iK的性能比锐龙7X高出1.2%。
达芬奇是类似于PR的主流视频制作工具,从测试结果看,达芬奇对多核和单核利用率都挺高,其中最高的是iK,跑到了分,比锐龙7X高出8.3%,第二位是K,跑到了分,比锐龙7X高出3.7%,然后是锐龙7X、酷睿iK以及iK。
从这个性能排序以及之前的测试成绩,可以看出11代酷睿处理器在视频处理器应用上,性能提升幅度十分可观,iK以8核16线程规格超过了10核20线程的i9K,证明了其架构效能确有其优越之处,对于并行运算要比10代酷睿好得多。
AVX、PCI-E4.0性能测试
英特尔在第11代桌面级酷睿处理器中首次支持AVX系列拓展指令集。AVX系列拓展指令集其实就是AVX2指令集的拓展指令。如果简单解释的话,AVX拓展指令的可运用数据宽度变更大了,从AVX-/AVX-升级到了AVX-,支持更大数据宽度的指令集广泛运用于大型计算、深度学习、科学计算等领域,其中在11代酷睿处理器支持的AVX-_VNNI指令集,就是深度学习经常使用的矩阵运算指令集。11代酷睿通过该指令集的支持,能获得一定的深度学习加速运算能力。
目前AIDA64的基准测试已经支持AVX拓展指令集,我们通过AIDA64GPGPU基准测试就能见证AVX指令集的提升。可以看到单精度和双精度浮点算力在开启AVX指令集后,吞吐量提高了3.6倍,24-bit/32-bit/64-bit的整数吞吐量也提高了2-2.6倍,Julia碎形几何模型运算和Mandel碎形几何模型运算的成绩提升了2.2倍和2.4倍。
第11代酷睿处理器也首次在桌面平台支持PCIe4.0接口,搭配RXXT显卡,可实现PCIe接口的带宽翻倍。
同时PCIe4.0的M.2接口也达到了7GB/s的恐怖带宽。之后我们还会单独测试搭配三星Pro的性能并与X比较。
11代酷睿的功耗与温度表现
第11代酷睿处理器加入了AVX指令集,而主流拷机软件如:AIDA64和Prime95均支持AVX指令集,也就是说对于11代酷睿处理器来说,主流拷机软件能创造出比其他处理更残酷的负载环境,因此我们这次的负载与功耗测试,进行了两次测试,一次在默频设定下开启AVX指令集,一次在默频设定下关闭AVX指令集。(主板默认设定为开启)
首先是iK的AIDA64StressFPU测试,在默认开启AVX指令集时,功耗最高达到W,核心频率4.4GHz,处理器核心平均温度达到84.5度,处理器核心电压1.V;在关闭AVX指令集时,功耗最高达到W,在持续一段时间后稳定在W,这与英特尔的睿频机制有关,当突破PL1功耗上限时会持续一段时间高频然后回落到稳定水平,这时候处理器核心频率4.9GHz,处理器核心平均温度达到84.5度,处理器核心电压1.V。
当然,测试过程中我们使用的是NZXT海妖Z70mm水冷和华硕ROGSTRIXLCIIARGB水冷,这两款水冷都采用了第7代Asetek的水泵与水冷头结构,测试效能基本相同,可以将iK烧机时的温度降低至85度左右。
然后是iK的AIDA64StressFPU测试,在默认开启AVX指令集时,功耗最高达到W,核心频率4.6GHz,处理器核心平均温度70.8度,处理器核心电压1.V;在关闭AVX指令集时,功耗最高达到W,核心频率4.6GHz,处理器核心平均温度66.5度,处理器核心电压1.26V。
可以看到iK的散热压力要小得多,这使得iK在开启AVX指令集进行拷机测试时,处理器依然保持了4.6GHz的全核睿频频率。开启AVX指令集后,只是让iK的功耗变大了一些,核心平均温度提高了4度。
总结
根据上文对11代酷睿处理器的测试与剖析,11代酷睿处理器比较上一代产品,在基准性能测试和生产力性能测试中有着明显的提升。iK在视频渲染方面甚至超过了多出两个核心的K,更是在基准测试中以更强的单核成绩领先于K和X。可见“CypressCove”架构对于单核性能与多核性能的推动,达到了英特尔官宣的19%IPC提升。但功率方便表现就很令人担忧,显然这是14nm制程工艺带来的弊端。游戏方面,五颗测试的处理器在单机游戏上的表现非常接近,可见单机游戏更依赖显卡,对处理器负载不大。但在对CPU敏感的电竞游戏中,11代酷睿竟然出现了落后的状况,有点令人尴尬——毕竟媒体测试包里有个标语:designedtogame——但又在情理之中,这是因为内存控制器有全新设计,同时电竞游戏对多线程优化也不好,我们期待后续英特尔能继续优化新架构在电竞游戏上的性能表现。
与11代酷睿一同登场的还有Z主板,支持PCIE4.0、Resizablebar,这两个新技术能带来明显的性能提升,还有更多可玩的ABT智能睿频技术(仅i9支持)、AVX2、AVX调节功能,对于会超频的玩家,11代酷睿处理器增加了更多探索的乐趣。同时,三大主板厂商纷纷推出高端Z产品,消费者的选择面还是很多的,后续我们再进行相关评测,为大家梳理更多关于系列芯片组与11代酷睿处理器的深度内容。
最后分析11代酷睿到底值不值得买呢?可以说,intel在14nm上真的尽力了,性能提升比上一代产品更明显,比较适合还在用着前几代酷睿的内容创建者与设计师考虑升级。但制程的限制也是不可回避的现实,高功耗也带来周边配件的压力。另一方面核显性能的大幅提升,倒是迎合当前属于特殊时期的需求,先用核显顶着等到显卡价格回落是个不错的策略。总之,没有卖不出去的货,只有卖不出去的价。只要价格符合自己的心理预期,想买就值得买。