Top
首页 > 正文

NVIDIA实现性能巨大飞跃,GeForce RTX 40系列开创神经网络渲染新时代

由Ada Lovelace架构和DLSS 3赋能;采用第三代RTX架构的GPU比NVIDIA Ampere架构GPU快4倍。
发布时间:2022-09-21 14:36        来源:赛迪网        作者:

太平洋时间2022920美国加利福尼亚州圣克拉拉,2022秋季GTC大会——NVIDIA今天发布GeForce RTX® 40系列GPU,旨在为游戏玩家和创作者提供革命性性能,其中新旗舰产品RTX 4090 GPU的性能相较上一代提升最高可达4倍。

作为全球首款基于全新NVIDIA® Ada Lovelace架构的GPU,RTX 40系列在性能和效率上都实现了巨大的代际飞跃,意味着实时光线追踪和利用AI生成像素的神经网络渲染的新时代已然来临。

NVIDIA创始人兼首席执行官黄仁勋在GTC大会主题演讲的GeForce® Beyond特别直播上介绍到:"RTX光线追踪和神经网络渲染的时代正在全面展开,全新 NVIDIA® Ada Lovelace架构将其推向了新的高度。”

"Ada为游戏玩家提供了质的飞跃,并正在为完全基于仿真的未来游戏铺路。Ada的性能是上一代产品的4倍,并为整个行业设立新标准。"黄仁勋表示。  

图片1

NVIDIA Racer RTX是利用GeForce RTX 40系列GPU和NVIDIA DLSS 3创建未来游戏内容的例子

DLSS 3可生成全新帧以加速游戏性能

黄仁勋还宣布NVIDIA DLSS 3 --用于游戏和创作应用的 Deep Learning Super Sampling深度学习超级采样是神经网络图形技术的下一次革命。这项由人工智能驱动的技术可以生成全新帧,从而大幅提高游戏性能。DLSS 3也可以通过允许GPU生成全新帧来克服受CPU限制的游戏。

DLSS 3即将加入到全球最热门的游戏引擎包括Unity Engine和虚幻引擎中。同时,DLSS 3也已获得众多全球领先的游戏开发者的支持,超过35款游戏和应用即将支持该技术。

图片2

此外,RTX 40系列GPU具有一系列新的技术创新,包括:

Ÿ 流式多处理器具有高达83 TFLOPS的着色器能力,吞吐量超过上一代产品2倍。

Ÿ 第三代RT Cores的有效光线追踪计算能力达到191 TFLOPS,是上一代产品2.8倍。

Ÿ 第四代Tensor Cores具有高达1.32 Petaflops的FP8张量处理性能,超过上一代使用FP8加速性能的5倍。

Ÿ 着色器执行重排序(SER)通过即时重新安排着色器负载来提高执行效率,从而更好地利用GPU资源。作为与CPU的乱序执行一样的重大创新,SER为光线追踪带来最高可达3倍的性能提升,整体游戏性能提升可高达25%。

Ÿ Ada光流加速器带来2倍的性能提升,使DLSS 3能够预测场景中的运动,使神经网络能够在保持图像质量的同时提高帧率。

Ÿ 架构上的改进,与TSMC 4N定制工艺技术紧密结合,实现了高达2倍的性能功耗比飞跃。

Ÿ 双NVIDIA编码器(NVENC)将输出时间至多缩短一半,并支持AV1。OBS、Blackmagic Design DaVinci Resolve、Discord以及更多的公司都已在采用NVENC AV1编码器。

全新光线追踪技术让游戏更具沉浸感

几十年来,用正确的物理照明来实时渲染光线追踪场景一直被认为是图形学领域的重大突破。同时,随着3D游戏和图形学不断努力提供对现实世界最精确地展现,环境和物体渲染的几何复杂性也在不断增加。

实现物理准确的图形需要巨大的计算能力。像《赛博朋克2077》 (Cyberpunk 2077)之类的现代光线追踪游戏,我们对每个像素执行超过 600 次光线追踪计算来确定光照,这与四年前推出的首批光线追踪游戏相比,提升达16倍。

全新第三代RT Cores可以提供2倍的光线与三角形求交性能,以及两个全新的重要硬件单元。Opacity Micromap引擎将光线追踪的Alpha-Test几何性能提升2倍;而全新的Micro-Mesh引擎可动态生成微网格,以产生额外的几何图形。Micro-Mesh引擎可在提升几何图形丰富度的同时,不以传统复杂几何图形处理的性能和存储成本为代价。

RTX Remix、新AV1编码器重新定义创作

RTX 40系列GPU和DLSS 3为所有NVIDIA Studio的创作者带来了助力。3D艺术家无需代理就可以利用精确的物理学和逼真的材料渲染完整的光线追踪环境,并实时查看效果。

视频编辑和直播也因GPU性能的提升和全新第八代编码器中AV1的加入而得以提升。NVIDIA Broadcast软件开发工具包有三个更新,包括:面部表情预估,眼神追踪,以及虚拟绿幕的质量改进,现已提供给合作伙伴。

包含在NVIDIA Studio全套创意应用中的NVIDIA Omniverse™即将增加NVIDIA RTX Remix。NVIDIA RTX Remix是一个MOD平台,用于为经典游戏添加RTX效果。RTX Remix允许MOD爱好者轻松捕捉游戏素材,利用强大的AI工具自动增强材质,并通过光线追踪和DLSS快速将游戏RTX化。

推出《传送门》(Portal)RTX版

NVIDIA Lightspeed Studios利用RTX Remix 重新设计了Valve的经典电子游戏《传送门》(Portal),该游戏被认为是有史以来最好的视频游戏之一。全景光线追踪和DLSS 3等先进的图形功能为该游戏带来了引人注目的全新画质和整体体验。恰逢《传送门》(Portal)15周年,《传送门》(Portal)RTX版免费DLC将于11月发布。

GeForce RTX 4090和4080:全新的终极GPU

图片3

GeForce RTX 4090 GPU是全新GeForce RTX 40系列的旗舰产品,是全球首款基于全新NVIDIA Ada Lovelace架构的游戏GPU

RTX 4090是全球最快的游戏GPU,在功耗、静音、散热等方面技惊四座。在完整的光线追踪游戏中,与上一代采用DLSS 2的RTX 3090 Ti相比,采用DLSS 3的RTX 4090的性能提升可达4倍。 在现代游戏中,RTX 4090的性能提升高达2倍,同时保持了相同的450W功耗。RTX 4090具有760亿个晶体管、16384个CUDA®核心和24 GB高速美光GDDR6X显存,在4K分辨率的游戏中持续以超过100 FPS运行。RTX 4090将于10月12日上市,建议零售价¥12999元起。

NVIDIA还宣布推出采用两种配置版本的RTX 4080。RTX 4080 16GB拥有9728个CUDA核心和16 GB高速美光GDDR6X显存,在现代游戏中的性能可达GeForce RTX 3080 Ti的2倍;在较低功率下,性能比GeForce RTX 3090 Ti更强大。RTX 4080 12GB则拥有7680个CUDA核心和12GB 美光 GDDR6X显存,比上一代旗舰GPU -- RTX 3090 Ti性能更强大。

两种配置版本的RTX 4080将于11月上市,建议零售价分别为¥9499元起和¥7199元起。

购买途径

华硕、七彩虹、耕升、影驰、技嘉、映众、微星和索泰等顶级显卡供应商将在中国推出GeForce RTX 4090和4080 GPU标频版和超频版。 

NVIDIA也将限量推出RTX 4090和RTX 4080(16GB)FE版,以满足渴望获得FE版设计的粉丝需求。

GeForce RTX 40系列GPU还会通过宏碁,外星人,华硕,戴尔,惠普,联想和微星等全球领先OEM的产品出售。

每日必读

合作站点