NVIDIA在CES Keynote发表会上,重磅宣布新一代GeForce RTX 5070的游戏性能可媲美上一代旗舰RTX 4090,这消息让不少玩家眼睛为之一亮,但这也是受惠于DLSS 4的AI 4x四倍画格生成技术才能办到的事。而RTX5070较适合做为2K主力游戏卡,或者搭配DLSS 3成为新一代4K入门游戏卡,以及DLSS 4满足4K全光追游戏体验。
主流2K、入门4K的NVIDIA GeForce RTX 5070
GeForce RTX 5070采用RTX Blackwell构架GB205 GPU,具备6144个CUDA核心、192个Tensor Core与48个RT Core,预设GPU Boost时脉为2512 MHz,搭配12GB GDDR7內存、192-bit / 672 GB/s频宽、显卡功耗TGP 250W等规格。
RTX 5070 相比上一代RTX 4070规格,主要CUDA核心数提升4%,相同12GB的视讯內存容量,但升级至频宽较高的GDDR7內存。但同样的RTX 5070美金定价$549元,比上一代RTX 4070定价$599美元便宜50美元。
NVIDIA 将在3/5日推出RTX 5070,但同时会遇上对手AMD的Radeon 9070系列的价格战打击,这就留待到时在与各位玩家分享;这篇还是以RTX 5070的性能,以及对比上一代RTX 4070与RTX 4090来比较。
Blackwell重点:Neural Rendering、DLSS 4、Transformer、Reflex 2
NVIDIA GeForce RTX 50 系列采用RTX Blackwell构架,主要针对Neural Rendering打造新一代SM流处理器,包含CUDA并行计算核心、RT Core 负责光线追踪与Tensor Core处理神经网络运算,并通过RTX Neural Shaders让游戏引擎可以靠着AI获得更出色的图像材质、材料与光线等表现,而且可以有效降低传统渲染所需的內存使用量。
另一方面,DLSS 4 多画格生成技术使用5个神经网络生成游戏图像,搭配Blackwell硬件的Flip Metering确保图像顺畅更新,让游戏引擎只需渲染1/16的画格,就可以靠着DLSS 4生成15/16的画格,带来8x倍的游戏性能提升。并且是RTX 50独家支持的技术。
至于DLSS通过6年的不断学习,在游戏、渲染运算等应用中大放异彩,而在RTX 50推出之际NVIDIA也着手将DLSS使用的CNN模型升级成Transformers模型,而这升级是所有RTX用户都能启用,只要NVIDIA App应用开放就能手动Override调整AI模型设定。
Reflex 2采用「Frame Warp」新技术,是指当GPU已经渲染好图像后随着鼠标移动,需要重新渲染整个画面的空间,但套用「Frame Warp」技术则是直接移动原本渲染好的画面,并通过前一帧的图像、颜色数据与深度数据,将空白的画面InPainting填满。可达到75%的延迟降低,并且是DLSS 4的强制启用功能。
开箱
NVIDIA GeForce RTX 5070 创始版体积稍微缩小,显卡长度24.3cm、宽度9.7cm、同样占用2-slot插槽的安装空间,相比RTX 5090 / 5080创始版更适合迷你主机SFF安装。RTX 5070 创始版维持着「双穿透气流」的独特设计,采用电路板置中、搭配均温板、热导管、散热鳍片与双风扇,让创始板无须厚重的散热鳍片,也可压制这代RTX 50 GPU的温度。
创始板外包装更符合环境友善采用相当低调的纸盒,手撕的封条拆开后就会看到「Inspired by Gamers. Enhanced by AI. Built by NVIDIA.」这句话,这也反映出现在的行业现况,游戏与玩家密不可分相互启发与影响,而现代即时光线追踪或实做全景光线的游戏,则都需要透过AI超分辨率、画格生成等方式强化图像,最后则使用NVIDIA打造的GPU执行游戏。
GeForce RTX 5070 FE 创始版,体积稍微缩但维持着「双穿透气流」的设计,一样有着独特的X框架与全金属材料打造,整体线条更佳圆润有细节,两组缜密的散热鳍片。显卡正面,则有着两颗9cm轴向式风扇,藉由置中的电路板,让两颗风扇的气流可穿透显卡。
显示输出则提供3个DisplayPort v2.1b与HDMI 2.1b,HDMI支持4K 480Hz / 8K 120Hz DSC与VRR、HDR等功能。
RTX 50系列创始版提供的是新版「PCIe 12V-2×6柔软编织PCIe 8pin转接线」,RTX 5070需要使用2个PCIe 8pin转PCIe 12V-2×6。而新版接头的编织线柔软度相当高,且在接头处还多了一层保护,确保玩家装机理线时不会影响接头的密合度。
最后送上RTX 5070与RTX 5090创始版的显卡比较。
创作影音输出、GPU渲染性能测试
此次测试包含创作DaVinci Resolve 19、Procyon AI生成、Blender与V-Ray等创作测试,游戏则以2160p、1440p分辨率、特效全开测试电竞、AAA 游戏与光追游戏的性能,并将DLSS 4单独测试,让玩家更能了解RTX 5070相比前一代RTX 4070的性能提升,并搭配RTX 5080与RTX 5090性能,让玩家能了解这代GPU的性能差异。
测试平台
处理器:AMD Ryzen 7 9800X3D
主板:ROG CROSSHAIR X870E HERO
內存:G.Skill DDR5-6000 16GBx2
显卡:NVIDIA GeForce RTX 5070、RTX 4070
系统碟:Solidigm P44 Pro 1TB PCIe 4.0 SSD
散热器:ROG RYUJIN II 360
电源:FSP MEGA Ti 1650W
操作系统:Windows 11 Pro 24H2 64bit、Resizable BAR On
驱动版本:NVIDIA 572.50
GPU-Z 可检视NVIDIA GeForce RTX 5070信息,采用4nm制程的GB205 GPU,有着6144个渲染CUDA核心,以及12288 MB GDDR7(SAMSUNG)內存,而GPU预设时脉2325 MHz、Boost 2512 MHz。
DaVinci Resolve 19 纯粹通过GPU加速的影片剪辑程序,更包含强大的色彩校正与特效功能,并且直接使用CUDA核心运算,让影片剪辑的回放与输出都有着相当好的性能。测试版本已支持RTX 50的4:2:2编码比率。
测试项目是一段44秒的小短片,来至于Blender Open Movie Project《Tears of Steel》,并有着8k Prores442HQ 30FPS与4K Prores422HQ 30FPS的视频,可用来测试输出HEVC 4:4:4与4:2:2的编码性能差异。
RTX 5070 仅只有1组NVENC编码引擎,在处理8K30 H.265 4:4:4编码输出时,需要2分47秒的时间;相比RTX 4070慢11秒。若是影音工作需求,建议RTX 5070 Ti以上的型号。
Blender是跨平台、开放源码的3D创作工具,支持着各种3D作业:Modeling、Rigging、Animation、Simulation、Rendering、Compositing与Motion Tracking等。而测试,则以Blender Benchmark 3.3.0进行Demo项目的渲染工作测试。
Blender Benchmark 4.3.0测试,RTX 5070 在三个场景的测试中,每分钟Sample数量约是上一代RTX 4070的21%提升,但比起RTX 5070 Ti渲染性能约降低-18%。
V-RAY 6 Benchmark是由Chaos Group所开发,V-Ray 是基于物理法则所设计的光线渲染软件,而此工具可分别针对CPU与GPU进行光线追踪的渲染图象的运算测试。
通过RTX运算,RTX 5070 达到5889 vpaths的每分钟光线运算量,相比上一代RTX 4070有着30%的性能提升,但比起RTX 5070 Ti渲染性能约降低-27%。
生成式AI测试IMG、LLM
UL Procyon AI Image Generation Benchmark提供Stable Diffusion XL(FP16)与Stable Diffusion 1.5(FP16)的两种测试情境,并支持ONNX runtime with DirectML、NVIDIA TensorRT与Intel OpenVINO的推论引擎。
测试版本目前Stable Diffusion还未支持TensorRT引擎,并提供新的FLUX.1模型支持FP8与FP4精度与TensorRT引擎,可以用来测试新一代RTX 50支持原生FP4精度的运算性能。上一代或其余RTX GPU,一样可运算FP4精度但相对更耗费硬件性能。
RTX 5070目前在主流的Stable Diffusion XL(FP16)、ONNX测试中,因为內存不足而无法完成任务,但是上一代RTX 4070却还是能完成任务,这就留待日后软件更新解决了。
至于在FLUX.1 FP4精度上,RTX 5070也只需要13s秒即可生成图片。
UL Procyon AI Text Generation Benchmark提供ONNX模型包含Phi-3.5-mini、Llama-3.1-8B、Mistral-7B 与Llama-2-13B测试,每个模型测试7个Prompts包含RAG与非RAG的查询,通过权重后的总分与平均Time To First Token(TTFT)、平均Output Token Speed(OTS)提供专业用户横量电脑的AI LLM推论性能。
RTX 5070 在4个LLM测试下都有着不错的成绩,相比上一代RTX 4070约提升16%的性能,但输给RTX 5070 Ti约-25%的性能。
3DMark跑分性能测试
3DMark Fire Strike绘图性能测试,为主流的DirectX 11 API的测试情境,分别测试1080p、Extreme 1440p与Ultra 2160p的性能。3DMark Time Spy则是采用DirectX 12 API所设计的测试情境,同样是锁定在AAA游戏等级,分别测试1440p与Extreme 2160p的性能。
RTX 5070在Fire Strike绘图达到57676分、Extreme 28969分、Ultra 14291分的成绩。至于Time Spy绘图成绩,RTX 5070获得22254与Extreme 10661分。
RTX 5070在3DMark绘图测试上,相比上一代RTX 4070在Fire Strike提升37%、Time Spy提升26%的性能。但比起RTX 5070 Ti的性能分别降低-20%、-21%。
3DMark光线追踪场景测试,像是最早推出的Port Royal在AAA游戏中的场景中加入光线追踪功能,考验着新一代GPU对于硬件光线追踪加速的能力;以及单独测试DirectX Raytracing API的DXR功能测试;最后Speed Way则是使用全光线追踪所开发的测试情境。
RTX 5070在Speed Way达到58.24 FPS、Port Royal 65.12 FPS的光追性能,这是未开启DLSS加速的原生性能。
RTX 5070在3DMark光追情境测试上,相比上一代RTX 4070有着21%提升。但比起RTX 5070 Ti的性能降低-27%。
3DMark DLSS Feature Test可针对DLSS 4、DLSS 3与DLSS 2进行性能测试,设定为3840 x 2160、Performance加速。
RTX 5070 原生30.32 FPS,通过DLSS 4多画格生成可达到194.18 FPS,足足6x倍的性能提升。
4款电竞游戏性能测试
4款电竞游戏《虹彩六号:围攻行动》、《英雄联盟》、《APEX英雄》与《Counter-Strike 2》等,都是重技巧、团队的战术竞技射击、DOTA 类型的游戏,因此游戏画质、细节不高的状况下,游戏FPS也都是平均百帧以上的表现。测试以2160p / 1440p、特效最高设定进行。
RTX 5070在主力1440p分辨率下,CS2平均267.8 FPS、APEX平均287 FPS、英雄联盟平均532 FPS、R6平均434 FPS。当然这性能表现上至4K电竞也不成问题。
分辨率提升至2160p,RTX 5070在CS2平均147.4 FPS、APEX平均186 FPS、英雄联盟平均511 FPS、R6平均248 FPS。对于电竞游戏这性能也非常足够满足4K 100 FPS的性能要求。
8款游戏性能测试
8款AAA游戏平均性能,同样测试2160p / 1440p特效全开进行测试,这段测试不开启光追功能与任何超分辨率加速,主要测试GPU的实际传统渲染游戏性能。
游戏测试名单有《F1® 24》、《古墓奇兵:暗影》、《地平线:期待黎明》,以及吃重性能的《边缘禁地3》、《碧血狂杀2》、《刺客教条:维京纪元》、《战神》与新加入的《流亡黯道2》等测试。
RTX 5070在1440p、不追光不加速的AAA游戏中达到平均148.6 FPS;而在2160p分辨率下平均则达到87.6 FPS,无疑可做为新一代入门4K游戏显卡。
RTX 5070在1440p、AAA游戏测试上,相比上一代RTX 4070(平均124.3 FPS)约提升20%的性能;比起RTX 5070 Ti(平均187.5 FPS)约降低-21%的性能。
至于2160p分辨率下RTX 5070相比上一代RTX 4070(平均72.9 FPS)约提升20%的性能;但比起RTX 5070 Ti(平均114.2 FPS)约降低-23%的性能。
7款光追游戏测试
7款光追DXR游戏测试,使用2160p / 1440p分辨率,特效/光追最高设定外,也会启用DLSS 3加速、画格生成等设定,但为了更好单独与上代GPU比较,因此将DLSS 4画格生成独立测试,详细设定请参考图表说明。
测试游戏有《暗黑破坏神IV》、《阿凡达:潘朵拉边境》、《极地战嚎6》、《漫威星际异攻队》、《电驭叛客2077》、《巫师3:狂猎》与《黑神话:悟空》等游戏。
RTX 5070在1440p、光追、DLSS 3加速的游戏中达到平均146.4 FPS。《电驭叛客2077》平均170 FPS、《巫师3:狂猎》平均147 FPS与《黑神话:悟空》平均93 FPS。
RTX 5070 在1440p、光追游戏测试上,相比上一代RTX 4070(平均122.1 FPS)约提升20%的性能;但比起RTX 5070 Ti(平均185.3 FPS)约降低-21%的性能。
至于RTX 5070在2160p分辨率下平均96.2 FPS。相比上一代RTX 4070(平均77.2 FPS)约提升25%的性能;但比起RTX 5070 Ti(平均121 FPS)约降低-21%的性能。
DLSS 4多画格生成性能实测
这段测试主要以2160p分辨率、特效最高、全开光追的设定,并分别比较原生性能与DLSS 4加速后的性能表现,使用《漫威争锋》、《霍格华兹的传承》、《Alan Wake 2》(全光追)与《电驭叛客2077》(全光追)进行测试。
RTX 5070在《漫威争锋》原生45 FPS、DLSS 4加速237 FPS约5.2x倍提升;《霍格华兹的传承》原生33 FPS、DLSS 4加速155 FPS约4.7x倍提升。
其中提升最多的莫过于使用全光追的游戏,《Alan Wake 2》原生9 FPS、DLSS 4加速至97 FPS约10.7x倍提升;《电驭叛客2077》原生10.6 FPS、DLSS 4加速120.4 FPS约11.3x倍性能提升。
功耗与温度测试
显卡的功耗与温度测试,使用Speed Way Stress test、Furmark2与《电驭叛客2077》进行测试。功耗测量时使用NVIDIA提供的PACT工具,可监控PCIe插槽与电源12V提供的瓦数。
显卡温度方面,RTX 5070 在压力测试最高温维持在75.5°C,而GDDR7內存温度最高则在82°C,至于2077游戏时温度则会稍微降低70.2°C。
功耗方面,RTX 50与RTX 40世代都采用相同的制程,RTX 5070功耗最高来到259W。
总结
GeForce RTX 5070 可满足4K 60 FPS的入门性能需求,即便对上次世代全光追游戏也可靠着DLSS 4画格生成提供稳定、低延迟的高效能。RTX 5070 在2160p分辨率于8款AAA游戏平均88 FPS、7款光追DLSS 3加速游戏平均96 FPS,更在DLSS 4多画格生成加速下达到平均152 FPS的超高性能。
RTX 5070 相比上一代RTX 4070有着22%的游戏性能提升,相比RTX 5070 Ti稳定降低-22%的游戏性能。至于RTX 5070对上RTX 4090,则是有着将近-40%的性能差距,但这差距只要靠着DLSS 4的AI 4x画格生成大魔法,即可让RTX 5070反超RTX 4090约8%的性能领先。
没有RTX 5070 Ti给人的激情,RTX 5070 就像是教科书中的公式一样,比上一代同级高20%的性能、比同一代上一阶输-20%的性能,但值得庆幸的是RTX 5070美金定价比上一代便宜$50美元。
若是预算有限但想要上至4K分辨率的玩家,那RTX 5070搭配DLSS 4画格生成,做为4K入门卡肯定非常有吸引力。但若是徘徊在主流2K与4K入门之间的玩家,或许会觉得RTX 5070的价位还是稍高一些(尤其首波量少的状况下)。
总之RTX 5070将在3/5号正式推出,但同时也会有RX 9070系列推出,预算有限的玩家不妨在等等,或许RTX 5060系列也在不远处了。