技嘉GeForceRTX5080XTREMEWATERFORCE16G显卡评测:超“冷静”,更能超!DLSS4开启4K高刷体验

太平洋科技 2025-04-27 14:31:17

写在开头

2025 年的硬件市场被英伟达的 RTX 50 系显卡彻底搅动,尤其是作为旗舰的 RTX 5090 一经登场便如炸弹般引爆行业,凭借全新的服务器级 Blackwell 架构带来的炸裂性能,搭配 DLSS 4.0、Reflex 2.0 等前沿技术,瞬间成为全球玩家和专业用户追捧的焦点。然而,耀眼的性能背后是令人咋舌的售价,让不少预算有限的用户望而却步。在这样的市场背景下,作为次旗舰的 RTX 5080 走进了大众视野。相较于RTX 5090,RTX 5080在核心数量、显存配置等方面或许有所精简,但依托同代 Blackwell 架构的底层优势,依然承载着英伟达在图形处理领域的最新技术成果。对于那些既想体验新一代显卡性能,又希望控制成本的用户来说,RTX 5080无疑是最佳首选。

本次评测就带大家看看RTX 5080的表现如何,这次我们上手的显卡为技嘉GeForce RTX 5080 XTREME WATERFORCE 16G,又被玩家亲切的称为“水雕”,是技嘉的高端旗舰系列,不管是用料规格还是实际的性能跑分都无愧于水雕的名号。无论是酣畅淋漓的电竞游戏,还是对图形处理要求极高的设计工作,亦或是 AI 智能学习领域,都能轻松驾驭,为你带来前所未有的极致体验。接下来,我们将从架构解析、性能实测、散热表现等维度展开深度评测,揭秘技嘉GeForce RTX 5080 XTREME WATERFORCE 16G显卡,一起来看看吧!

规格介绍

开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代的引入了神经网络着色器,力图为游戏开创先进、高效更有逼真的渲染方式,带给玩家全新的游戏体验。

相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。

第五代Tensor核心

其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor核心,新一代Tensor Core添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。

第四代RT核心

而光线追踪技术的革新则仰赖于第四代RT核心的加持,相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。

综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。

第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。

该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了CPU的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。

另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将内存占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。

GDDR7显存

第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带來更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。

神经网络着色器

接着我们再细说一下这一代架构最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。

在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。

这里举个例子让大家能够更简单的理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。

目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入到DirectX中,玩家能够体验到更真实的游戏世界。

而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。

另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor核心也能共同分担着色工作,大大提高了着色效率。

这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到Tensor核心上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可编程渲染管线,现在开发者或API也能更好的调用Tensor核心,未来游戏内我们能见到的AI技术势必越来越多。

先进的AI管理处理器

此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,亦或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。

而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好的保障。

GeForce RTX 5080规格

说了这么多,接下来给大家介绍一下GeForce RTX 5080的硬件规格,不同于老大哥采用的GB202核心。GeForce RTX 5080采用的是GB203,核心代号为GB203-400-A1。在架构上拥有7个GPC,但每个GPC包含的TPC并不相同。GeForce RTX 5080上总共集成了42个TPC,84个SM单元,336个TMUs纹理单元,112个ROPs光栅化处理单元,10752个CUDA核心。

在工艺制程方面,新的GB203核心沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为378mm2,内部晶体管数量则有456亿,在这么小的空间内堆下如此之多的晶体管,可以说是绝对工业艺术品的集大成之作了!早前看过我们RTX 5090 D的玩家应该都知道它的功耗达到了前所未有的575W,不过作为次旗舰的GeForce RTX 5080就保守一些了,仅比上代提升了40W,TDP设定为360W,玩家选购时配备一个850W的电源绝对是绰绰有余了。

除此之外,GeForce RTX 5080还配备了全新的GDDR7显存,显存等效频率可达32Gbps,同时16GB的大容量显存也能为玩家提供高分辨率下的极致帧率,同时还能兼顾大部分AIGC用户的应用需求,多重黑科技加持下,高分辨率出图也可更加高效。同时视频输出接口也进行了升级,能够兼顾高分辨率与高刷新率,后续开箱显卡时我们会详细介绍。

至于我们本次上手的技嘉GeForce RTX 5080 XTREME WATERFORCE 16G与MSRP版本的GeForce RTX 5080的区别则主要体现在用料配置上更加高端,同时得益于水冷散热器的加持,因此它的性能释放也会更加激进,频率也会比较高。其基础频率与MSRP版本一致,均为2295MHz,不过Boost频率提升至2805MHz,这个频率不仅比MSRP版本高出不少,就算是在一众超频版的RTX 5080里也是鹤立鸡群的存在,相当夸张。

显卡外观赏析

技嘉GeForce RTX 5080 XTREME WATERFORCE 16G,既有旗舰级的性能释放,又有水冷散热加持,随时能够保持冷静。

这款显卡的包装盒相当吸睛,正面是经典的雕型Logo,不过其用上了金属加机械的风格设计,既彰显了这款显卡为电竞而生,同时也表明了它隶属于大名鼎鼎的水雕系列。包装盒左下角印的则是这款显卡的相关配置,例如配备了技嘉引以为傲的水之力散热系统,显卡还搭载了16GB的GDDR7显存,同时技嘉显卡还能享受领先业内的超长4年质保服务。

包装盒的背面就比较简单了,主要为显卡内部用料的详细介绍。比如这款显卡搭载的水之力散热系统,主动散热设计+被动散热模组为GPU、显存和MOSFET等关键元器件提供高效的散热解决方案,以确保系统在高频下的稳定性。

再来看看技嘉GeForce RTX 5080 XTREME WATERFORCE 16G本体,整张显卡可以分为两部分,分别是显卡本体以及360水冷散热器。

技嘉 GeForce RTX 5080 XTREME WATERFORCE 16G 的外观设计堪称艺术品。显卡整体采用了黑色为主色调,搭配金边视觉分层设计,展现出一种冷峻而高贵的气质。右侧的透明件上刻有AORUS 的标志,给人一种强烈的科技感,斜切的纹理则加强了显卡的层次感。

值得一提的是,显卡的正面与边缘藏有LOGO灯以及灯光线条,利用亚克力的导光特性,正面AORUS LOGO能够展现光与影交错的层次变化,打造出极具科技感的奢华视觉效果。

通过技嘉GCC软件你还可以自定义灯带的颜色,打造专属于自己的游戏利器。另外GCC软件还有更多功能,例如:调节风扇转速、超频等。

通电的一瞬间,显卡正面的RGB灯板率先亮起,内部是经典的技嘉LOGO,五颜六色的效果为通体黑色的显卡增添了一色点缀。

360冷排上的两把风扇同样支持ARGB调光,随着电源接通,两把风扇开始肆意舞动,灯效闪耀,让整机颜值更进一步。

显卡背面的设计与正面颇有异曲同工之妙,采用了一体成型的金属背板设计,做工考究,质感十足。整体还是以黑色作为基底,但引入了拼接的灵感,让整张显卡的颜值跃升一步,妥妥的工艺美学设计品。

背面中央这是显卡的大脑——GB203-400-A1核心,拥有10752组CUDA核心,稍多于前代的RTX 4080 SUPER,通用的图形性能自然更强。而在工艺制程方面,新的GB203核心沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为378mm2,内部晶体管数量则有456亿,在这么小的空间内堆下如此之多的晶体管,可以说是绝对工业艺术品的集大成之作了!

视线转移至显卡的顶部,这里也沿用了拼接的设计风格,左侧是NVIDIA显卡经典的GEFORCE RTX字样,右侧则是镂空的AORUS LOGO标识,并且下面还藏有RGB灯条,当显卡通电时,能够亮起RGB灯效,进一步提升显卡辨识度。

顶部还有显卡的供电接口,被安排在显卡顶部最靠右的位置,目的是装机时尽量不让电源线挡住这款显卡的颜值,接口为12V-2×6接口,单口可提供600W供电能力。

底部则是显卡的金手指,这一代显卡的PCIe接口升级成为了5.0速率,这也是首次在RTX 50系显卡上应用,能够带来更高的传输速率,另外仔细看金手指的形状,它和上一代的显卡也有些微的变化。

视频输出接口部分,还是经典的3个DP加1个HDMI的配置,不过规格上有了升级,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G采用的是DP 2.1b与HDMI 2.1b规格,理论上,这一代显卡的视频输出接口可以轻松实现4K 480Hz和8K 240Hz超高分辨率与超高刷新率的需求。

再来看技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的另一部分,其配备了巨大的360水冷,官方称之为水之力散热系统。其内部分为主动散热以及被动散热两部分,出色的散热效能为这款显卡带来了极致的性能释放潜力与绝佳的噪音控制能力。

让我们先看主动散热的设计,风扇部分,冷排上安装了3个配备双滚珠轴承的120mm ARGB风扇,不但高效低噪,还拥有出色的使用寿命,喜欢RGB的玩家还可以通过技嘉控制中心(GCC)来自定义灯效实现整套主机的灯效同步。

冷排部分,显卡使用了优化设计的360mm铝质冷排,通过巨大的散热体积提供了极高的热容,从而让风扇在低转速下也能保证足够的散热效果,有效降低了显卡满载工作的风扇噪声。

而被动散热部分则仰赖于内部的全铜底板散热设计,铜质底板直接与GPU与显存接触,同时冷头的水路还延伸到了MOSFET区域,能够进一步提升整卡的散热效果。

除此之外,显卡内部还配备了高端的液态金属复合硅脂,配合服务器级导热凝胶,让整个水之力的散热系统能够实现吸热最大化,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G时刻都能冷静输出。

技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的冷头端与360mm冷排端则是用编织网的铁氟龙管进行连接,不仅可以有效提高水管抗物理损坏的能力,同时还增加了显卡整体的颜值。

总的来说,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G绝对称得上旗舰中的旗舰,不仅搭载了高端的GB203核心,在用料和规格上都远超其他RTX 5080,搭配一体式水冷散热设计,可以让玩家进一步挖掘RTX 5080显卡的性能潜力,获得更加极致的游戏体验,完全就是发烧级玩家装机的首选装备。

测试平台介绍

开始性能测试前介绍一下本次的测试平台, CPU使用的是目前毫无争议的游戏神U——AMDRyzen R7-9800X3D,主板则是来自技嘉的X870 AORUS ELITE WIFI 7主板,,刷新到最新版本BIOS的同时,在BIOS中开启X3D模式,以便获得更好的性能表现。

内存为G.Skill的幻锋戟Z5 RGB DDR5,在这块主板上能轻松达成DDR5-8000 C38的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。

完整测试平台配置如下:

理论性能测试

开始测试前,照例还是要“认识”一下这张显卡。从GPU-Z的信息中可以看到技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的基准频率为2295MHz,这一点与大多数RTX 5080显卡一致,不过Boost频率相当高,为2805MHz,这个频率不仅比公版RTX 5080要高,对比前代RTX 4080的话,更是还是提升了不少,同时也要远高于一众OC版本的RTX 5080。除此之外,由于是超频版显卡,因此这张显卡的TDP也可以提升到更激进的水平,默认为360W,不过可以进一步解锁至450W,为超频预留了充足的空间。

理论性能部分看3DMark,在Fire Strike系列测试中,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G完全超越想象,表现非常亮眼。其中4K分辨率下领先RTX 4080约26%,2K下可以领先RTX 4080约30%,最夸张的是1080P,差距可以拉大至32%。而在以DX12为代表的Time Spy测试中,新显卡同样逆天,对比RTX 4080 SUPER或RTX 4080显卡均能做到领先约16-18%,性能提升还是非常可观的。

除了Time Spy以及Fire Stirke提升明显外,光追项目也有史诗级的提升,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G得分22036,这个成绩遥遥领先于RTX 4080甚至是RTX 4080 SUPER,分别领先23%和25%。而在最新的Speed Way测试里,同样也有超24%的性能提升。

DLSS 4专项测试

看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最“顶”的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。

而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。并且每次渲染额外帧只需要AI模型执行一次,就能输出三帧画面,因此无论是对性能、显存的开销还是延迟都比之前要好了许多。

另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能的将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。

同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟系了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。

不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》等,《黑神话:悟空》也将于今年晚些时候升级支持 DLSS4的多帧生成。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。

简单介绍完,我们再看看DLSS 4的理论表现如何,还是经典的3DMark测试。不得不说技嘉GeForce RTX 5080 XTREME WATERFORCE 16G搭配上DLSS 4后,帧数就跟打了鸡血一样,开关前后的性能简直天壤之别!其中2K分辨率下,开关前后性能差距足足有4倍之多。4K分辨率时帧数差距直接就是6倍,即便是对比DLSS 3的话,帧数也能提升70%以上。最离谱的还要属8K,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G在DLSS 4加持下可以做到156 FPS,这已经畅玩爽玩的水准了。

接着我们看看DLSS 4在实际游戏中的表现,率先登场的就是有着“显卡杀手”之称的《赛博朋克2077》,它的设置页面是目前支持DLSS 4游戏中最为丰富一款,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。

我们直接来一波对比,左侧为Transformer模型,右侧则是原本的CNN模型。从第一个场景来看,Transformer模型能够带来更多的细节。例如左侧图片中的栏杆倒影,这部分表现是比较清晰的,而CNN模型中则几乎不可见。

第二个场景也是能够一眼看出区别的,例如金属门的纹理细节以及砖墙的接缝处,明显是Transformer模型的优化要更好一些。

这个场景的区别主要在于地板细节刻画以及右侧铁栏杆部分,采用Transformer模型的情况下,地板细节更接近真实世界,并且铁栏杆的细节也能更好的还原。而CNN模型则会丢失比较多的细节,虽然不影响观感,但总有种“失真感”。

不过Transformer模型目前也并非万能,毕竟是由AI生成而来,因此在部分细节上还是有些错误的。例如下方的窗口部分,阳光照射下应该是斑驳的光影,比较正确显示的应该是CNN模型中的样式。整体来看,现在Transformer模型瑕不掩瑜,大幅改善的画面细节能够给玩家带来更精致的游戏展现。

见识完Transformer模型的魅力以后,我们再来看DLSS 4的性能表现,毕竟是“显卡杀手”,对显卡的压力确实不一般,在最高画质+路径追踪的情况下,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G只能跑18.74 FPS。开启DLSS 3以后,游戏帧数为104.62 FPS,体感已经非常流畅了。开启DLSS 4以后,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G能够做到184.42 FPS,对比原生分辨率,性能足足提升了8.8倍。1%Low就更离谱了,几乎快要追上DLSS 3下的平均帧了,整体游戏体验更佳。

DLSS 4带来的性能提升是有目共睹的,不过也有玩家担心DLSS 4的画质表现如何,这里我们也在游戏中截取了部分画面,第一个场景其实差距不大,肉眼很难分辨出区别。

第二与第三个场景还是能够看出部分细节的,例如第二幅图中的霓虹灯牌,DLSS开至性能档以后,能够看到灯牌与前面三张图有些许差异,不过你得靠细致的对比才能看出。实际游戏过程中很难发现,基本不影响观感。

总的来说,DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。如果你是敏感型玩家,那建议可以开至平衡档,在画面质量和帧率之间能够做到很好的平衡。如果你是追求超高帧率,那性能档也绝对可用,细节保留也不错,不对比基本看不出,同时帧率还能进一步提高。

第二款游戏则是NVIDIA在前段时间强力推荐的《半条命2》RTX版,这款游戏不仅支持了DLSS 4,同时也在游戏中加入了RTX神经网络辐射相关的技术,与初始版本的《半条命2》相比,画质可以说是史诗级的进步!

实测下来,只能说《半条命2》RTX版对硬件的开销极大,在原生4K分辨率下,所有画质、光追均开至最高,不开启超分选项时,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G几乎不可玩,帧数仅有36 FPS。在开启DLSS 3性能档以后,游戏帧数瞬间来到了104 FPS,体验都变得丝滑了许多,而继续开启DLSS 4性能档,游戏帧数又在原来的基础上再度飞跃,来到了190 FPS,对比原生4K的表现,性能提升高达5.2倍!1%Low的表现更离谱,领先幅度来到了6.5倍以上。

DLSS 4带来的性能提升是有目共睹的,同时DLSS 4的画质也表现极佳,这里我们还是在游戏中截取了部分画面,基本上可以说DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。

另外,游戏设置中还可以切换DLSS 4的另一个特性——Transfomer Mode,这里我们也截图了相同的场景进行对比,从下图可以看出Transformer模型能够带来更多的细节。例如左侧图片中的墙壁,这部分表现是比较清晰的,细节也更多,而CNN模型中则几乎不可见。图片中主体的木屋纹理也是Transformer模型下会更清晰,线条更锐利。

我们测试的第二款DLSS 4游戏是《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2则是原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能,另外你也可以选择插2帧的方式,也就是所谓的×3选项。

实际测试过程中,我们发现《霍格沃兹之遗》这款游戏优化还是不错的,4K分辨率画质光追均设置最高的情况下,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G在不开任何超分的情况下,平均帧为78 FPS。如果开启DLSS 3性能档,此时帧数已经能够做到203 FPS了,体验已经相当丝滑了。开启DLSS 4以后,帧数可以进一步提升至358 FPS,对比原生4K时,性能提升了约4.5倍以上。同时实际游戏过程中,无论是1%Low还是延迟都不错,特别是延迟,相比原生分辨率还要低不少,跟手感更好。

第三款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持×4的选项,也就是DLSS 4多帧生成功能。

实测DLSS 4在这类优化欠佳的游戏中确实大有用处,在4K原生分辨率下,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的平均帧仅有20 FPS,延迟也是高得吓人,游玩堪称PPT。而开启DLSS 4性能档以后,游戏平均帧直接暴增至170 FPS,游戏体验如德芙般丝滑,对比原生4K的表现,足足有8.5倍左右的提升。即便是对比DLSS 3的95 FPS,那也是接近翻倍的性能提升。

最后一款游戏是我们的老熟人《漫威争锋》,这款游戏在RTX 50系显卡首发之时,它还没有完全适配DLSS 4,玩家想要体验多帧生成功能还需要依靠NVIDIA App的DLSS 4优设功能。不过现在《漫威争锋》也正式支持DLSS 4了,与上面的游戏一样,玩家在游戏设置中就能直接开启,并且提供了2x、3x以及4x选项,玩家可以随意选择是插一帧、插两帧还是插三帧。

实测技嘉GeForce RTX 5080 XTREME WATERFORCE 16G在4K全高设置下,不开超分,帧数为74 FPS,流畅玩是没问题了,不过想要追求高刷体验就要开启DLSS 3了,开启后帧数可以达到190 FPS,相比原生分辨率已经提升了一倍以上,如果再开启DLSS 4多帧生成,性能对比原生分辨率直接提升4倍以上,327 FPS的表现妥妥的电竞3A。同时延迟表现也非常出色,原生分辨率下,其延迟为26ms,而开启DLSS 4以后,延迟甚至能够降低至23ms,游戏会更加跟手,体感更佳。

当然,如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4优设功能,说人话就是能够让游戏强开DLSS 4,像此前的《漫威争锋》,在未更新前,玩家可以直接在NVIDIA App中简单设置,就能将帧生成调至“4×”,一键实现多帧生成。目前也有不少游戏支持DLSS 4优设功能,感兴趣的玩家可以前往体验。

DLSS 4多帧生成功能的问世,毫无疑问为玩家带来了前所未有的游戏体验升级。与上一代RTX 40系的DLSS 3帧生成功能相比,它再次实现了帧数的惊人飞跃。在相同的画质设置下,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的表现远远超越了RTX 4080。实际测试中,在上述五款游戏里,开启DLSS 4的技嘉GeForce RTX 5080 XTREME WATERFORCE 16G,帧数几乎是RTX 4080的两倍!

另外,值得一提的是,与DLSS 4一起到来的还有全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,这其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显的感觉到游戏的不流畅、卡顿。

为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。

而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。

另外,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。

而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。

首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》,后续我们也会第一时间带给大家该技术的详细评测。

游戏性能测试

DLSS 4非常“逆天”,能够带来极致的帧数表现,不过这也需要厂商对DLSS 4进行适配,考虑到目前不是所有的游戏都已经支持DLSS 4,因此下面我们要测试的是常规的游戏以及支持DLSS 3的游戏性能。

还是老样子,先跑3DMark的DLSS 3性能测试。技嘉GeForce RTX 5080 XTREME WATERFORCE 16G在2K分辨率下,对比RTX 4080或RTX 4080 SUPER,性能提升幅度大概在27%左右,4K分辨率下,开启DLSS 3以后性能领先也基本维持在25%,考虑到三张显卡的CUDA核心几乎没有差距,只能说老黄确实是有点东西。

实际游戏表现又如何呢?这里我们选取了11款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分,如有则采用最高。

实测4K分辨率下,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G应对绝大多数游戏都轻轻松松,特别是在DLSS的加持下,满足4K@144Hz电竞没有问题,即便是全高设置的《黑神话:悟空》,这款显卡也能有87 FPS的表现,基本碰到了高刷的门槛,后续如果有DLSS 4想必帧数提升会更加迅猛。具体到性能上,在这么多款游戏里,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G整体比RTX 4080 SUPER强约20%左右,如果对比RTX 4080的话,性能领先幅度则可以扩大至25%以上。

图像视频创作性能测试

看过了游戏,下面就是专业创作领域的内容了。先给大家伙看一下综合场景的性能表现,在PCMark10 Extended测试,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G在游戏、数位内容创作方面的表现更佳,基本上要比RTX 4080高10%和15%左右,而生产力方面的成绩则比较低,推测是目前驱动还不完善所致。

办公软件测试中,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G表现也不错,应该不会有人质疑旗舰级显卡的办公能力吧,这个级别的卡用来办公有点杀鸡焉用牛刀的感觉了,不过实测数据来看,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G整体性能可以领先5%左右,其主要领先在Excel、PPT以及Outlook三项。

在Adobe以及达芬奇的Benchmark测试里,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G比RTX 4080或RTX 4080 SUPER也有不小提升,不过提升比较大的还是视频编辑部分,究其原因还是这一代RTX 5080对编码器进行了升级,不仅编解码的效率更高,同时支持的格式也更丰富。例如在达芬奇和PR的测试中,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G轻松领先RTX 4080约7-17%,后续软件如果加以优化,提升幅度还能更多,总体来说换装RTX 50系显卡能够让你的内容创作的效率更高。

3D渲染创作性能测试

图像视频创作过后,就该上点强度,测测渲染方面的表现了,让我们看看压力更大的3D渲染以及工业领域软件中,在Blender以及V-Ray两款软件中,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的表现可以用夸张来形容,其中前者基本上能领先RTX 4080 SUPER达3%-16%,而后者就离谱了,对比两张40系卡,甚至可以领先84%,几乎是翻倍的性能提升了。

再看看另外一款渲染器,D5 Render是一款基于DXR和光线追踪技术构建的GPU渲染器。正因为其有光线追踪技术,其渲染的画面相当出色。这款软件在RTX 40系显卡测试时支持了DLSS 3帧生成,而现在随着RTX 50系显卡的发布,它也可以通过NVIDIA App的方式支持最新的DLSS 4多帧生成功能。

实测在开启DLSS 4以后,整个渲染预览的界面变得丝滑流畅,帧数基本都在226 FPS附近,而对比不开DLSS时,仅59 FPS的表现来看,性能几乎是提升了4倍以上。即便是面对RTX 40系的DLSS 3,也一点不虚,性能优势也有50%以上。

工业领域的表现也是上到了新的高度,其中SPEC2020能够反应显卡的工业能力,在多项测试中技嘉GeForce RTX 5080 XTREME WATERFORCE 16G,对比RTX 4080平均有30%的提升,而对比RTX 4080 SUPER也在25%左右。如果你对测试中的软件有需求,强烈建议你升级到最新的RTX 50系显卡,工作效率翻倍!

NVIDIA编解码测试

接下来的测试则是介绍RTX 50系显卡的编解码器,GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同时由于GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此用户可以体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。

这里我们直接使用NVIDIA提供的4K60片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。实测同一段素材下,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G导出三段视频的时间分别是9秒、10秒以及13秒,效率分别比RTX 4080或RTX 4080 SUPER快了111%、90%以及54%。

同时,我们也对导出的不同格式的视频进行了画质对比,实测AV1编码的视频在画质上与H.265或H.264也没有明显差距,无论是在文字、人像还是建筑等画面里,三者的画质可以说是伯仲之间,如果不特地标注其格式,一般人很难用肉眼分辨出来。随着目前越来越多视频网站、剪辑软件和硬件厂商的推动,未来AV1势必会成为下一个最受欢迎的格式。

值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。

4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。

AI性能测试

AI性能目前也是大家关注的重点,特别是在国产大模型爆火以后,各行各业都开始接入AI,似乎AI成了必选项。RTX 50系显卡也针对AI进行了改进,其中最值得说道的就是其加入了对FP4精度模型加速处理的支持,它相比此前RTX 40系上的FP8精度,能够实现更快的生成速度,同时显存占用也更低。

不信你看,我们用UL Procyon的FLUX.1 AI Image Generation Demo For NVIDIA进行测试。在均使用FP8精度模型时,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G能够做到13.705s生成一张图,而RTX 4080或RTX 4080 SUPER则要17秒以上;而切换到FP4精度模型后,速度才真正拉开了差距,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G生成图片的速度能够提升到6.742秒一张,效率翻了一倍不止。而RTX 4080或RTX 4080 SUPER的生成时间则不降反升,两代显卡的性能差距拉大到了3.5倍以上。

并且FP4精度模型生成的图片也非常能打,从下图就能看出来,其与FP8生成的图片几乎没有区别,无论是对关键词的理解还是图像的质量,都非常有保障。

看过了FP4以及FP8,我们再看看技嘉GeForce RTX 5080 XTREME WATERFORCE 16G在Stable Diffusion中FP16以及INT8下的表现如何,还是用UL Procyon进行测试,在比较轻松的SD 1.5文生图测试里,无论是采用FP16精度模型还是INT8精度模型,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的表现都远超前代显卡,特别是在INT8精度下,生成一张图的速度仅需0.54秒,效率比上代显卡快了48%,已经接近一倍了。而即便是在压力比较大的SDXL中,优势也非常明显,生成一张图的速度为8.439秒,同样领先RTX 4080或RTX 4080 SUPER约1-2秒。

在AI文本生成测试中,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G在一众大语言模型里同样表现出众,我们用MLPerf Client v0.5大语言模型进行测试,它是基于meta的Llama 2 7B开源LLM打造,涵盖了四项AI任务,分别是内容生成、创意写作以及对两份不同长度文本进行总结摘要。实测新显卡在每一项中都表现出了绝对的统治力,各项测试均遥遥领先,性能提升幅度均在16-18%左右。

接着我们又用UL Procyon的AI Text Generation测试了更多的大语言模型,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的优势依旧十分明显,在以Llama 3.1 7B LLM打造的Phi-3.5测试中,新一代显卡取得4522分的成绩,相比RTX 4080提升了16%,相比RTX 4080 SUPER则提升了6%;将参数扩大至13B的Llama 2的测试,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G也能对答如流,4790分的表现已经离RTX 4090不远了,对比性能的话,则可以领先RTX 4080约28%,领先RTX 4080 SUPER 22%以上。

最后,当然少不了我们的国产大模型DeepSeek-R1的测试,现在也是越来越多玩家开始用本地部署去玩转AI了。我们分别用三款显卡本地部署DeepSeek-R1:14B的大模型,让其回答“如何本地部署DeepSeek-R1大模型?”这个问题,实测技嘉GeForce RTX 5080 XTREME WATERFORCE 16G回答这个问题只需14秒,tokens可以达到72.39 tokens/s。作为对比,即便是RTX 4080 SUPER也要21秒才能回答完成,并且tokens/s为59.7,远远落后于技嘉GeForce RTX 5080 XTREME WATERFORCE 16G,差距为26%,基本与上面的测试相符。

超频潜力测试

下一项测试超频,作为技嘉的当家旗舰,又怎么能够不试试它的超频潜力呢?在超频前给大伙回顾一下它默认状态下的成绩,Speed Way得分9092。

在技嘉GCC软件中将功耗解锁至125%、风扇转速手动拉满的情况下,我们首先给核心加300MHz,显存加500MHz,此时Seepd Way得分9718,相比默认状态的分,提升幅度已经非常可观了,为6.8%。

继续增加核心与显存的频率,核心加350MHz,显存加1000MHz,Speed Way得分上升至9924,已经接近万分大关了。对比默认的分数,提升幅度加至9.2%。

最后,我们成功将技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的核心加了350MHz,GPU基础频率从2805MHz提升至3155MHz,显存则是加了3500MHz,频率从30Gbps提升至33.5Gbps。此时Speed Way得分10174分,软显核心频率3322 MHz,不得不说技嘉GeForce RTX 5080 XTREME WATERFORCE 16G确实厉害,这个成绩不仅远超一众非公RTX 5080,甚至还能与RTX 4090 D掰掰手腕。

功耗与温度表现

最后一项测试烤机,这也是许多玩家关注的重点。技嘉GeForce RTX 5080 XTREME WATERFORCE 16G配备了水之力散热系统,360冷排的规格非常唬人,我们也非常期待这款显卡的表现,Furmark烧机10分钟后,得益于技嘉GeForce RTX 5080 XTREME WATERFORCE 16G出色的设计底蕴,核心温度并不高,仅有54.8度,显存温度更是低至60度,此时显卡的最大功率为360 W,已经完全顶着TDP的上限了,风扇转速则是1150 RPM,表现相当惊人,几乎听不到任何噪音。

横向对比RTX 4080或RTX 4080 SUPER时可以看到,虽然新显卡的TDP提升了,不过整体的烤机功耗并不算高,特别是技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的核心与显存的温度都还控制得不错,风扇噪音也完全无感,非常适合那种追求极致性能释放,但又对音量有高要求的玩家。

评测总结

实测完技嘉GeForce RTX 5080 XTREME WATERFORCE 16G后,感觉其还是相当惊艳的。它将前沿科技与艺术美学巧妙融合,不仅打造出极具视觉冲击力的外观造型,更依托先进水冷散热方案,确保强大性能持续稳定输出,实现了颜值与实力的完美平衡。

相较于其他RTX 5080显卡,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G在设计上可谓下足了功夫,纯黑酷炫的设计风格,彰显出高端显卡的独特气场;透明的亚克力面板,搭配绚丽多变的 RGB 灯效,赋予显卡独特的个性魅力,无论何时都能成为焦点。精致细腻的做工与质感,每一处细节都经过精心打磨,尽显旗舰级产品的卓越品质。

性能表现上,RTX 5080自然无需担心,而技嘉GeForce RTX 5080 XTREME WATERFORCE 16G得益于“超频”的加持,性能直接更上一层楼。相较上一代 RTX 4080 在游戏性能与 AI 计算能力等多个维度均实现了显著提升。游戏场景中,DLSS4 技术的加入使其在高分辨率下帧率表现更为出色,部分游戏甚至能与上一代旗舰 RTX 4090 一较高下;而在 AI 与创作领域,16GB 大显存则成为巨大优势,不仅凭借性能提升带来更优创作体验,更在深度学习、复杂图形渲染等场景中显著提升处理效率,减少数据传输时间成本。

散热配置上,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G再次将豪华进行到底!全新升级的水之力一体式水冷系统,内部配备了高端的液态金属复合硅脂、服务器级导热凝胶,同时还有正面的三把120mm超大散热风扇坐镇,配合360冷排,能够在满载环境下将GPU温度压制在50℃左右。这个成绩说夸张一点都不为过,综合表现在一众RTX 5080中是绝对不输的,甚至可以说是Top1的存在。同时显卡的噪音控制也非常出色,这种“游刃有余”的表现,正是高端显卡应有的素质。

最后聊聊选购建议,作为AORUS系列的旗舰型号,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G不仅是一款高性能显卡,更是科技美学与工程设计的集大成者。无论你是追求极致性能与设计的硬核玩家,还是创意无限,效率至上的专业创作者以及 AI 开发者,这款显卡都将成为您的理想之选。目前这款显卡已在技嘉官网、京东、天猫等平台开售。售价14999元起,感兴趣的玩家不妨关注一下~

0 阅读:2