前言▲AMD 今天推出了 Radeon RX 6600 显卡,RX 6600 是 8 月发布的 RX 6600 XT 的后续产品。它被定位为纯 1080p 性能分段卡。▼以下是AMD本场发布会最有意义的两张PPT:▲RX 6600在以上游戏的1080P分辨率下的性能足以和RTX3060抗衡。▲RX 6600每瓦功耗的性能表现超越RTX3060。▲Radeon RX 6600存在最大的意义是完善了和NVIDIA GPU 领域所有价位点的竞争,在RTX3050系列和RTX3060之间价位插入了一把锋利的尖刀。在AMD RX 6000全线产品中,只有RX 6600和6600XT是PCIe 4.0 X8接口带宽的,而其他产品都是PCIe 4.0 X16接口带宽的,而且RX 6600和6600XT同属于Navi23核心,不过他们还是有区别的。▲Radeon RX 6600 XT采用了7nm Navi23 XT芯片,芯片编号为215-130000006▲Radeon RX 6600 使用的是7nm Navi 23 XL芯片,芯片编号为215-130000016▲RX 6600XT采用的是完整的Navi23 XT核心,支持所有 16 个 DCU/WGP和 64个ROPs,▲这里的DCU就是Dual Compute Unit,也就是双计算单元。▲Navi23每个Compute Unit计算单元里面包含了64个Stream Processors流处理器、4个Texture Mapping Units(TMUs)纹理映射单元以及1个Ray Accelcrator光线追踪加速器。那么一个DCU里就包含128个Stream Processors流处理器、8个Texture Mapping Units(TMUs)纹理映射单元以及2个Ray Accelcrator光线追踪加速器,这很好理解。所以对于RX 6600XT而言Stream Processors流处理器应该是64X2X16=2048Texture Mapping Units(TMUs)纹理映射单元=4x2x16=128ROPs=64Ray Accelcrator光线追踪加速器=2X16=32▲但新的RX 6600为Navi23 XL核心,相比完整的XT核心,XL屏蔽了16个Dual Compute Unit(DCU)双计算单元中的2个,仅剩下14个Dual Compute Unit(DCU)双计算单元,其他均不发生变化。所以所以对于RX 6600而言:Stream Processors流处理器应该是64X2X14=1792Texture Mapping Units(TMUs)纹理映射单元=4x2x14=112ROPs=64Ray Accelcrator光线追踪加速器=2X16=32他们都具有相同的32 MB 片上 Infinity Cache,以及相同的 128 位 8GB GDDR6显存。唯一的区别是内存速度区别。这也直接造成RX 6600的显存带宽是224 GB/s ,而RX 6600 XT 的存带宽是256 GB/s。说了这么多,大家应该很清晰了,RX 6600就是把RX 6600XT的16个DCU砍掉了2个,然后把核心和显存频率进行了向下微调的产物。▲本次首发的8大品牌AIB的Radeon RX 6600产品。其中ASRock华擎首发推出两款产品:▲ASRock Radeon RX 6600 XT Challenger ITX 8GB▲ASRock Radeon RX 6600 Challenger D 8GB其实这两款产品PCB,频率,BIOS都是一样的,唯一的区别就是散热器。简单解读就是Challenger D 8GB虽然散热更好但是PCB一样是ITX短卡规格。本次评测带来的产品就是来自ASRock华擎的Radeon RX 6600 Challenger D 8GB。开箱▲包装正面▲包装背面▲显卡本体正面,物理规格为269 x 132 x 41 mm, 2-slot▲显卡本体背面▲显卡顶部▲显卡底部▲IO接口部分为3个DisplayPort™ 1.4 支持 DSC, 1个HDMI™ 2.1 VRR拆解▲拆解本次使用的硅胶垫▲散热器本体,虽然只有双热管,但是双热管之间进行了焊接合并,稍许提高散热效率。▲铝锌合金背板正面▲锌合金背板背面▲PCB正面▲PCB背面▲AMD Radeon 6600核心和6600XT一样是Navi 23系列,AMD称之为Navi 23XL,而6600XT使用的是Navi 23XT,Navi 23XL使用 TSMC N7(7 纳米)工艺制造,芯片面积 237 平方毫米,芯片编号芯片编号为215-130000016。▲显存使用了四颗SKhynix出品的H56CBM24MIR-S2C的GDDR6显存,GDDR6被华擎设定在 1750 MHz(14 Gbps GDDR6 有效)运行。▲溯源到官网查询到,该显存标准速度7GHz,单颗16Gb也就是2GB,四颗组成8GB的显存容量。▼下面解析一下供电设计▼GPU供电部分使用 5+1相:IOR35217+(5+1)相SiC654A▲PMW芯片是 IR35217▲DrMOS使用的是50A Vishay SiC654A 。▼显存供电部分:NCP31022N+2相SiC654A▲显存电压采用两相设计,PMW芯片是NCP81022N ,DrMOS使用的一样是50A Vishay SiC654A 。ASRock这次的供电用的中规中矩,不浮夸,不盲目堆料,真的,一个RDNA2的入门级产品堆料的理由都没有。测试平台▲• CPU : AMD Ryzen 7 5800X• MB : ASRock X570S PG Riptide• Dram : Oloy DDR4-3600 16GBx2• SSD(sys): Samsung PM9A1 1TB• GPU : ASRock Radeon RX 6600 Challenger D 8GB• Cooler : Thermalright AK120MINI• PSU : Greatwall GW-EPS1560DA• VS GPU:ASRock Radeon RX 6600XT Challenger D 8GBASRock Radeon RX 6700XT Challenger D 8GBZotac Geforce RTX 3060 12GB• Windows 10 Workstation Edition X64 20H2参数解析▲可用于RX 6600的驱动目前有2个,第一个是AMD的内部测试版驱动发布于10.6日,版本是AMD Radeon Software 21.30.17.06▲另外一个版本是AMD官网提供下载的10.12发布的AMD Radeon Software 21.10.2,感觉测试版的驱动更新一些,所以以下测试均在21.30.17.06下完成。▲ASRock 预设的频率和AMD公版完全一致,GPU核心基础频率2044MHz,Boost频率为2491MHz,GDDR6频率1750MHz。▲主板驱动联合21.30.17.06显卡驱动的整体自动超频体验良好。▲21.30.17.06驱动版本的超频设置允许你拉满核心和显存频率。▲拉满后,核心会提高到2850MHz,Boost频率为2900MHz,GDDR6频率1900MHz。下面进行性能测试,测试的基础是在默认频率下进行。Mining大家会发现默认频率下,进行ETH测试,核心频率boost到了2554MHz,显存频率1750MHz,计算速度达到27.6Mh/s,此刻功耗达到98W,显然这不是合适的配置,先进去驱动中心▲调整GPU核心最小频率1050MHz,最大频率1150MHz▲显存拉到1900MHz▲运行GMINER 2.7,GPU核心运行在1100MHz,显存运行在1900MHz,此时算力28M,功耗57-58W,温度49-52度,风扇20%。▲一般来说,比如RX 5700XT 6700XT这种卡性能浮动会比较大,有个2-4M算力波动很正常,但是RX 6600很稳,基本就是28Mh/s以上,只有轻微波动。▲如果要对比能耗比而言,RX 6600XT可以在57W下达到稳定31Mh/s计算速度。所以RX 6600感觉还有继续优化的空间。▲对比数据看一下,感觉RX 6600是显存拉胯了,如果驱动和显存的体质允许到2150MHz的话,应该可以到30Mh/s附近。可能是驱动锁住了显存频率,如果驱动允许的话,我觉得海力士显存的话长期1900MHz问题还不大,2150MHz长期用还真不一定靠谱。3DMARK▲TIME SPY测试得分8339▲全程最高温度51▲全程最高核心频率达到2284MHz▲TIME SPY EXTREME测试得分3862▲全程最高温度52▲全程最高核心频率达到2306MHz▲光线追踪能力系列测试PORT ROYAL显卡分数3729▲PCIe4.0的带宽,以X1为例,达到了2GB/s,而X8的带宽则达到了16GB/s,实测RX 6600的带宽达到13.69GB/s,所以AMD给这卡设定为PCIe4.0 X8也并没什么问题,因为RX 6600的带宽素质确实也达不到16GB/s。▲GPU全程最高核心频率达到2582MHz,显存频率1740MHz,CPU Ryzen 7 5800X全程几乎都在4.8GHz运行。▲结果汇总FARCRY5▲硬件标杆性质的游戏▲ULTRA画质三个分辨率下的平均FPS对比▲MEDIUM画质三个分辨率下的平均FPS对比选择这个游戏测试主要是想看一下RX 6600在这个标杆游戏中可以流畅运行的分辨率以及画质,现在看来1080K以及2K分辨率的中高画质是没有问题的。4K高画质的话,RTX3060其实也不太行,需要RX 6700XT及以上级别。CYBERPUNK 2077▲支持DXR的新一代硬件标杆性游戏▲关闭DXR,使用ULTRA画质进行测试三种分辨率的平均FPS。▲开启DXR,启用光线追踪开启阴影和反射的情况下以ULTRA画质测试三种分辨率的平均FPS。为什么选择这个游戏测试?其实是想讨论一个问题:为什么AMD RDNA2 的光线追踪性能比不上NVIDIA Ampere?我们就以RX 6600为例:RX 6600的GPU核心里的32个Ray Accelerator 光线追踪加速器由于有32 MiB Infinity Cache 的加持,理论上应该可以在相对复杂的场景中能提供更好的 BVH 遍历效率。RTX 3060 具有 28 个 RT Core、112 个 Tensor Core和 3,584 个 CUDA Core。基于知乎作者Edison Chen在他的文章中做出的测试数据分析:AMD RNDA 2 的每个Ray Accelerator 光线追踪加速器的硬件求交性能大约是 NVIDIA Ampere所配置RT Core光线追踪内核的 2/3。(溯源:https://zhuanlan.zhihu.com/p/337151778)这可能是AMD RNDA 2的光线追踪效能跑不过NVIDIA Ampere的主要原因,这也是RDNA 3肯定要重点解决的问题,AMD值得期待。
AMD 的RADEON ProRender 就是一个路径跟踪渲染引擎,基于 AMD 自己的 Radeon Rays 射线求交加速库,最新的 Radeon Rays 4.0 从原来 2.0 的开源项目改为了闭源项目并且不再提供 OpenCL 支持,透过 DX12、Metal 以及 Vulkan 提供 AMD 以及非 AMD 产品的支持。很多人包括我试用后感觉有两点:1、性能不够稳定,2、噪点较多,现在看来,这个渲染器很大可能上受限于AMD的Ray Accelerator 光线追踪加速器的硬件求交性能。所以看似简单的Ray Accelerator 效率问题,其实影响了从民用GPU到专业GPU多条产品线的产品性能,真的,后发而至的RDNA2的光线追踪求交达到Ampere的三分之二已经不容易了,其实对RDNA3还满抱有期待的,RDNA3任重而道远。SPECviewperf 2020 v2.0▲SPECviewperf 从13到2020 V2,本质没有区别,用于测量在OpenGL和Direct X应用程序编程接口下运行的系统的3D图形性能。这个软件就没什么好说的了,大家很熟悉且都在玩,但是我想说,它的运行效率和我们实际去应用的体验并没有太多相关性,它的结果好也并不代表Adobe和Autodesk这些全家桶的应用效果好,因为它提取的轨迹实在太老了,很多都是2015年之前的软件版本以及轨迹。▲本测试全程使用GPU-Z记录LOG,然后用LOG VIEWER读取LOG后画图▲因为本测试由N多小模型组成,所以每跑完一个模型就会切换下一个,GPU核心的频率在切换模型的时候就会下降,所以呈现出这样一个急速上升下降的曲线态势,最高频率2584MHz,平均频率1796MHz。▲温度平均在47.5度,最高温度54度,最低40度▲功耗最低10W,平均63.47W,最高101W▲说到这个测试,很多人会误解这个测试中的成绩高的游戏GPU就可以用来取代Quadro RTX或者Radeon Pro了,我的话主要会盯住画面看画面轴的高速转动会否出现画面破碎,渲染离焦等驱动异常,还好,本测试没有发生,一路正常测试下来,画面完整。曾几何时,连Radeon Pro都会画面破碎的驱动竟然被AMD鬼使神差一般写好了。这个测试可以说明的问题是:如果你是重量级专业应用的话,一张Quadro RTX A4000或者以上级别的专业显卡才是你的良配。如果需要在专业软件内使用CUDA渲染加速,那么只有选择N卡。如果是轻量级别的专业应用,以上显卡都可以满足你的要求,综合性价比来决定,因为毕竟RDNA2的AMD驱动在专业软件中的表现已经超越入门级专业显卡的素质了。▼下面的几个测试涉及目前比较流行的生产力工具,且对GPU的性能还是有一定要求,所以测试使用了Puget Systems提供的TRACK测试工具对其进行分析,剔除CPU,磁盘,DRAM测试权重,单纯比较GPU的性能方面数据。Adobe Photoshop 2020▲本测试以Adobe Photoshop 2020为测试载体▲以PugetBench for photoshop 0.93.1为工具基准进行测试每个单独的任务总共运行 3 次,以最快的结果计算最终分数。完整运行大约需要 15-30 分钟,但会因系统性能而异。基准测试完成后,它将为您提供“总分”以及不同类型测试的个人分数。基准测试旨在测试广泛的任务,以便准确地全面了解系统在 Photoshop 中的表现,测试内容包括:一般任务:打开 18MP .CR2 RAW 图像,调整到 500MB,旋转,魔术棒选择,蒙版细化,油漆桶,渐变,内容感知填充,保存 .PSD 文件,打开 .PSD 文件过滤任务:Camera Raw 滤镜、镜头校正、降噪、智能锐化、视场模糊、移轴模糊、光圈模糊、自适应广角、液化 表示 GPU 加速的任务完成每个单独任务的时间与参考结果进行比较,每个任务的平均值用作该测试的分数。总分基于常规任务和筛选任务之间的 50/50 分配。其中的GPU 分数旋转、智能锐化、场模糊、倾斜移位模糊和虹膜模糊的结果的平均值,这是最充分利用显卡的五个任务。GPU分数的基准是以NVIDIA GeForce RTX 2080 8GB为100分参考基准。NVIDIA GeForce RTX 2080 8GBGPU分数:100▲测试数据汇总Adobe After Effects 2020▲本测试以Adobe After Effects 2020为测试载体▲以PugetBench for After Effects 0.93.2为工具基准进行测试本测试涉及到了许多不同的项目,其中包括一个专用的“GPU 压力”测试,该测试旨在往 GPU 上施加尽可能多的负载,同时仍保持在某人在现实世界中可能实际执行的范围内。 在 After Effects 等应用程序中查看 GPU 性能通常是检查 GPU 承受重负载的极端情况的情况,因此通过每个 GPU 的 After Effects 基准测试中看到的整体性能开始,GPU 分数是根据“GPU Stress”组合的性能计算得出的,该组合旨在将尽可能多的负载置于 GPU 上,同时最大限度地减少 CPU 作为瓶颈,可以很好地显示 After Effects 中不同 GPU 之间的最大性能增量。GPU分数的基准是以NVIDIA GeForce RTX 2080 8GB为100分参考基准。NVIDIA GeForce RTX 2080 8GBGPU分数:100▲测试数据汇总Adobe Premiere Pro 2020▲本测试以Adobe Premiere Pro 2020为测试载体▲以PugetBench for Premiere Pro 0.95.1为工具基准进行测试这个基准测试通过4K和8K分辨率以及29.97和59.94 FPS的各种编解码器来研究实时回放和导出性能。对于GPU测试使用专用的“重载GPU效果”单独向GPU施加尽量多的压力,使其超出普通Premiere Pro用户的工作范围来进行测试。测试的剪辑素材 (59.94 FPS)素材分辨率以及编码器包含:4K H.264 150mbps 8-bit (59.94FPS)、4K ProRes 422、4K RED、8K RED、8K H.265 100Mbps。对于每种类型的测试素材,进行四种测试:标准 - 两个 59.94FPS 片段串联,应用 Lumetri Color 效果2x Forward - 四个 59.94FPS 剪辑,在 119.88FPS 序列中将 Lumetri 颜色设置为 200% 速度,以模拟以 2 倍速度播放时的性能。4x Forward - 8 个 59.94FPS 剪辑,在 239.76FPS 序列中将 Lumetri 颜色设置为 400% 的速度,以模拟以 4 倍速度播放时的性能。MultiCam - 在多机位序列中跨四六个轨道的多个剪辑。在“多相机”显示模式下测试播放。这些测试都用于全回放分辨率的实时回放性能测试。标准测试还使用“Youtube 2160p 4K 超高清”预设(H.264、4K、40mbps)以及导出到 4K ProRes 422HQ 8-bpc 来测试其导出性能。关于GPU有一个“Heavy GPU Effects”测试,使用:串联的 Twp ProRes 422 剪辑,每个剪辑之间有交叉溶解高级效果:Lumetri Color、Ultra Key、Sharpen、Gaussian Blur、Basic 3D、Directional Blur 和 VR Digital Glitch。极致效果:Lumetri Color、Ultra Key、Sharpen、Gaussian Blur、Basic 3D、Directional Blur、VR Digital Glitch 和 VR De-Noise。通过导出到 ProRes 422HQ 来衡量性能。GPU 分数是 GPU Effects测试和 H.264 导出测试结果的平均值,基准是以NVIDIA GeForce RTX 3080 10GB为100分参考基准:NVIDIA GeForce RTX 3080 10GBGPU分数:100▲测试数据汇总BlackMagic DaVinci Resolve Studio 17.3▲本测试以BlackMagic DaVinci Resolve Studio 17.3为测试载体,以PugetBench for DaVinci Resolve 0.92.3为工具基准进行测试本基准测试主要使用各种编解码器以 4K 和 8K(仅限扩展预设)分辨率、OpenFX 以及 Fusion 中的性能进行渲染。测试的剪辑素材 (59.94 FPS)素材溯源自以下两家自媒体提供的样片:包含以下分辨率和编解码器:4K H.264 150mbps 8-bit、4K ProRes 422、4K RED、8K RED以及8K H.265 100mbpsGPU 效果部分侧重于 OpenFX 和降噪,包含以下效果:Temporal NR x3 - 2 Frames BetterTemporal NR - 2 Frames BetterFilm GrainSpatial NR - BetterLens Blur x5Lens FlareOptical Flow - 50% Enhanced BetterFace Refinement▲测试数据汇总最后需要说明的是,本次测试的剪辑素材来自以下两家自媒体:▲4K和8K RED剪辑视频来自老莱的工作室,这些剪辑也已转码以创建H.265和ProRes 422剪辑。Linus Media Group是老莱的公司,在YouTube上提供了流行的 LinusTips和 TechLinked频道。▲Neil Purcell是伦敦著名的照明摄影师,在广播电视领域拥有超过25年的经验。从事各种各样的作品;从戏剧到木偶,现场新闻和事实,儿童节目,灯光娱乐,真人秀,外部广播,重大体育赛事,音乐演唱会,流行视频,企业电影和商业广告。图中Neil Purcell(灯光摄影师/摄影操作员)正在以他的松下 GH5 拍摄 4K H.264 素材。本次测试使用的4K H.264素材来源于他的剪辑作品。总结华擎的RX 6600这卡其实用起来感受有几点:1、1080P下的高画质游戏需求基本可以满足,2K下也可以中画质一战。2、轻度生产力毫无问题,重度生产力也没弱到不可以使用,至少还是前代5600XT 5700XT之间的水准。3、能耗比继承了RX 6600XT的优势,我很怀疑根本Navi23 XL不是Navi23 XT的残次核心屏蔽而成,而是AMD直接把Navi XT关闭了两个DDU单元就直接用了。TSMC 7nm对付Navi23这么简单的Die构架应该毫无良品率之忧。4、说几句华擎的卡,华擎的卡我最喜欢的是每一代都出一张ITX型号产品,对比微星的AERO ITX,华硕的MINI,都是ITX爱好者比较认可的产品。除了ITX,Challenger D也不错,我曾摸过RX 5700XT系列的Challenger D的体质甚至好过TAICHI,加上近几年对辅料包括对新材料散热器硅脂的不断尝试,达到了高阶品牌竞品的制造水准。近两年的狂潮让华擎在Challenger D上收益颇丰,因为矿业用户和矿游边缘消费者不在意产品的个性化和差异化,有货就行,对价格不敏感。而现今的清矿大势颠覆了目标购买群体的属性,Gaming和生产力会再度成为消费级GPU的主流客户群,性价比会再度成为GPU消费主流观点,那么厂家更看重个性化和差异化会更有利于下一阶段的产品销售。RX 5700XT系列5、对于RX 6600性能定位其实我有一点猜想:我觉得AMD用RX 6600去对抗RTX 3060还是有点勉强,甚至RX 6600XT去抗RTX 3060一样勉强,近期笔记本搭载的RTX 3050以及3050Ti已经发布,那么桌面版的我想也不远了。纵观历史,NVIDIA成功跑量的产品是哪些?GTX750、GTX750Ti、GTX1050、GTX1050Ti,所以AMD一旦面对NVIDIA的X50系产品,就不得不多布设几条战线来提前狙击,发布会PPT所展现的RX 6600 VS RTX 3060猜测只是烟雾弹,真正AMD要突出的重点就是RX 6600的能耗比优势以及未来对RTX3050以及3050Ti的狙击战线已经布设完成,所以AMD很重视这个产品。集中渲染RX 6600 VS RTX 3060的概念目前看起来有点勉强,有助于后期营造出RX 6600 VS RTX 3050Ti的降维打压,如果能配上一个合理的价格,那RX 6600将会是NVIDIA半年内最头疼的竞品。本文经“什么值得买”社区作者@gaojie20授权转载,文章内容仅代表作者观点,与本站立场无关,未经授权请勿转载。
0 评论