“ 感知技术 · 感触CG · 感受艺术 · 感悟心灵 ”
中国很有影响力影视特效CG动画领域自媒体
在GTC 2022主题演讲上,黄仁勋正式发布了NVIDIA GeForce RTX 40系列GPU,在Ada Lovelace架构以及台积电TSMC 4N NVIDIA定制工艺下,GeForce RTX 4090 GPU拥有760亿个晶体管、16384个CUDA核心和镁光24GB GDDR6X显存,相对上一代旗舰GeForce RTX 3090 Ti的10752个CUDA核心提升超过50%,提升巨大。更多的CUDA核心对于内容创作者而言,无疑代表着更强的性能与更高的效率。但这也仅仅是开始,Ada Lovelace新架构用上了第三代RT Core和第四代Tensor Core,带来了全新光线追踪加速,AI性能以及DLSS 3技术同时给Omniverse带来了全新的RTX Remix平台,这些GeForce RTX 40系列GPU的新本事将会帮助内容创作变得更高效和轻松。现在,不妨让我们整理一些NVIDIA GeForce RTX 40系列媒体日的内容,来看看NVIDIA Studio提升到了什么程度。
目前为止,已经有超过1.1亿的内容创作者参与到NVIDIA Studio的内容创作中,这不是一个夸大的数字,从游戏制作到图像设计,从直播到短视频,从AI绘画到AI修图,只要涉及GPU加速的内容创作场景,很大程度和NVIDIA Studio有关系。经过NVIDIA的努力,在市面上已经有超过110款专业内容创作软件由RTX加速,哪怕是用Photoshop进行简单图片调整,或者Premiere对人物图像的动态抠取,每一个轻松操作背后,都有着NVIDIA RTX GPU的性能加速与技术支持。而今,NVIDIA Studio的规模还在以每年33%的速度成长,NVIDIA Studio已经构建了一套RTX GPU、NSD驱动、专业软件SDK、Studio套件和NVIDIA Studio认证PC的完整生态。毫无疑问,NVIDIA GeForce RTX 40系列将成为NVIDIA Studio生态再进阶的重要一环。根据NVIDIA官方解析,全新的第三代RT Core在新技术DLSS 3加持下将获得4倍光线追踪性能提升,全新改良的第四代Tensor Core性能直接翻番,最高搭配24GB DDR6X镁光显存也将提供高达1TB/s的传输速率。不仅如此,GeForce RTX 40系列还首次引入了第八代NVENC AV1双编码器,为视频编码带来40%以上的效率提升,视频输出速度更是提升到两倍。AV1编码是由英特尔、微软、亚马逊、谷歌、网飞等头部企业根据互联网需求制定的头部企业根据互联网需求制定的下一代视频编码格式,开放并且免费。它的特点是能在相同文件体积下拥有更高清的画质,或者相同清晰度的画质下拥有更小的体积。但与此同时,AV1编码对GPU的运算也有着更高的要求。其实在GeForce RTX 30的Ampere GPU中,已经引入了对AV1的硬件解码加速,但不支持硬件编码加速。从GeForce RTX 40系列的第八代NVENC双编码器开始,AV1硬件编解码变成了现实。如果与GeForce RTX 30系列进行对比,GeForce RTX 40系列的AV1编码器能比H.264编码器效率高出40%。这意味着AV1编码器能够利用现阶段可以进行1080p串流视频的带宽,实现1440p甚至更好的画质,让直播体验瞬间提升。为此NVIDIA与OBS Studio展开合作,在近期发布对HEVC支持的版本基础上添加了对AV1和HDR的支持,并很快融入到正式版本中。OSB Studio同时也针对NVIDIA GPU优化了编码流水线,让NVIDIA GPU能够再减少35%的性能开销,对于任何版本的N卡用户而言都是一个好消息。另外NVIDIA也利用这一波升级同步更新了旗下的NVIDIA Broadcast应用的功能,包括提升降噪与房间回声消除的性能,以及面部表情预估,眼神追踪,以及虚拟绿幕的质量改进等功能。针对时下流行的Discord社交软件,NVIDIA也利用AV1编码器改善了屏幕共享性能,让屏幕共享、视频对话变得更为清晰流畅,无需购买专业的麦克风、相机,或者配置专业的录音棚。但对于NVIDIA而言这还不够,为了进一步提升编码性能,配备12GB显存以上的GeForce RTX 40系列GPU,都将自动开启AV1双编码器。也就是说首发的GeForce RTX 4090、GeForce RTX 4080 16GB和GeForce RTX 4080 12GB三个版本,默认都会开启AV1双编码器。是的,利用大显存的优势,AV1双编码器可以轻松实现8K 60FPS专业视频编辑。亦或者同时处理4个4K 60FPS视频,从而实现一台电脑完成多路4K画质60FPS输出,放在以前是完全不敢想象的。在AV1双编码器推出的同时,与NVIDIA深度合作的行业软件同步更新,包括DaVinci Resolve、Adobe Premiere Pro插件Voukoder以及剪映在内的专业应用会在GeForce RTX 40系列上市的时候同步推出。除此之外,NVIDIA还宣布与时下流行的视频效果软件Notch,以及AI智能驱动的Topaz超级滤镜合作,很快也会提供对AV1双编码器的支持。除此之外,GeForce RTX 40系列GPU的NVDEC编解码器还支持MPEG-2、CV-1、H.264(ACVHD)、H.265(HEVC)、VP8、VP9等多种格式。对流式多处理器(Streaming Multiprocessor,SM)吞吐量的提升和改进,以及更高的时钟频率和CUDA核心数量,都成了GeForce RTX 40系列GPU为内容创作提供高于Ampere两倍的性能保障。但NVIDIA强调GeForce RTX 40系列还能将3D渲染性能提升至4倍,这时候就是光流加速器和DLSS 3登场的时候了。NVIDIA DLSS厉害的地方在于,利用AI神经计算图形的概念,减少了GPU大量传统的渲染工作。而Ada Lovelace架构所引入的DLSS 3技术,则是在DLSS 2实现超级分辨率功能的基础上,用更低的渲染资源,实现更流畅的画面效果。换而言之,DLSS 3是一种全新的AI解决方案,它厉害的地方在于可以生成整个帧,而不仅仅是图像中的部分像素。换而言之,之前的DLSS局限于同一帧下图像的细节,现在DLSS 3将考虑到前后帧的变化趋势。在技术构成上,DLSS 3由第四代Tensor Core和光流加速器实现。其中第四代Tensor Cores具有高达1.32 Petaflops的FP8张量处理性能,超过上一代使用FP8加速性能的5倍。全新的光流加速器如前面所说,可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而不使用传统游戏引擎的运动矢量进行建模。这极大地减少了AI在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。也因为如此,为了展示DLSS 3与光流加速器在动态光影效果中的表现,特意创建了一款Racer RTX游戏和DEMO演示内容。那么如此大阵仗的光影效果盛宴又是如何实现的呢?答案又回到了Omniverse身上。作为NVIDIA Studio上的重要平台,Omniverse已经能够兼容市面主流的专业软件格式。而《Racer RTX》也正好是3D创作者、技术创作者、光影艺术家、环境艺术家利用Omniverse协同合作的典范。利用Omniverse构建出的元宇宙,环境艺术家利用Autodesk 3ds Max新建了一个复杂生动的玩具、书房、卧室、客厅场景。与此同时3D创作者利用三维数字雕刻软件Pixologic ZBrush构建真实比例的玩具车。为了让玩具车看起来更真实、更富有质感,光影艺术家在3D艺术创作者建模的同时,为其增添不同的材质,细化玩具车的每一个细节。同时,技术创作者利用Unreal Engine模拟出玩具车的移动状态。你没有看错,四个领域看似不相关的内容创作者在Omniverse构建的平台中协同完成了这项复杂的工作。如果放在以往,这个项目需要分成四个组别逐一进行,期间还需要大量的沟通和交流,现在通过Omniverse即能实现每一个领域的创作者在完成自己工作的同时,也能看到其他艺术家的创作进度,所见即所得,完成无缝配合,正如NVIDIA CEO黄仁勋在媒体群访上所说:过去的10年是关于深度学习AI的发明。未来10年是关于AI的应用。而NVIDIA也正在一步步让我们看到AI将如何彻底改变PC游戏,将如何彻底改变虚拟世界,Omniverse, 乃至Metaverse。不仅如此,Omniverse还提供了大量的USD通用场景描述、路径追踪(Path Tracing)、AI加速、NVIDIA MDL材质定义以及物理模拟等等,大量的工具帮助创作者们能够更快的完成场景和玩具车的搭建工作。比如在构建庭院中沙池场景的时候,就可以利用Omniverse中的MDL导入、创建、编辑和选择不同的材质,让灰尘、颗粒乃至火、布相互碰撞,整个过程不在需要创作者用手工逐一模拟不同素材之间的碰撞效果,它更像是搭积木,利用Omniverse对真实世界的模拟,还原出真实,甚至意想不到的效果。当然,创作者也可以通过修改数字,让效果展现更夸张,以符合自己的创作需求,让作品区别于现实,同时也更具吸引力。在整个过程中,GeForce RTX 40系列GPU起到了极为关键的作用。利用GeForce RTX 4090与DLSS 3的搭配,在同一场景下编辑的画面帧率达到GeForce RTX 3090 Ti + DLSS 2的4倍。也就是说,在两者展现出相同内容的前提下,GeForce RTX 4090 + DLSS 3能够驱动Omniverse表达更流畅,等待时间更短,更能帮助内容创作者抓住稍纵即逝的灵感。可以这么说,GeForce RTX 40系列GPU与Omniverse的搭配构建了3D内容创建的新形式。通过实时的协作汇集反馈,让所有参与工作的艺术家同步进行协调。同时利用Omniverse强大的光线追踪效果、MDL材质、物理模拟,让场景组合与搭建变得更为容易。更重要的是,GeForce RTX 40系列GPU搭配DLSS 3的高性能展现,让预览画面能够以超过4K 60FPS的直观感受流畅进行,不再需要猜测构建场景的实际效果,因为所有的操作都将所见即所得。顺带一提,NVIDIA Racer RTX也将作为一个游戏DEMO,在今年11月份推出,让内容创作者和游戏玩家们直观感受不同领域创作者们,在短时间内完成的惊人游戏场景和真实效果。
NVIDIA似乎认为只做出一款Racer RTX游戏还不够,他们认为利用Omniverse还可以搞一波大的,基于Omniverse的RTX Remix,为游戏提供便捷的MOD平台孕育而生。为游戏创建MOD已经是玩家和数字艺术家们延续喜爱的游戏生命周期,扩展新玩法的重要形式。著名的《老滚5》、《半衰期》、《魔兽争霸》都留下了许多经典的MOD,并衍生出了时下火热的新游戏。每一年,关于MOD的下载会达到70亿次,超过1000万的Modder爱好者为MOD事业添砖加瓦,而这些数据都是在近2年内以2倍的速度增长。传统的MOD制作是个苦力活,由于做的是反向编译的工作,需要不断的忍受破解游戏导致的Bug,掌握复杂的工具包,甚至还需要复杂的创作流程以及忍受上古的渲染引擎和低效率。随着NVIDIA RTX Remix的推出,一切都开始变得不一样了。通过NVIDIA Studio旗下的AI纹理工具、光线追踪、DLSS 3和Omniverse平台协作,古老的3D游戏能够在短时间内获得翻新,不仅拥有高清素材,还可以加上实时光线追踪效果。重点是,对于Modder而言,这样的创作过程是非常轻松的。通过一次点击,RTX Remix就能捕捉到场景中的纹理、几何结构、光照情况。RTX Remix能够将抓去到的素材自动连接到USD通用场景素材包中,并开始创建重制场景,最终输出MOD,成为一个可以运行的MOD游戏,把自己钟爱的传奇游戏‘RTX化’变得易于上手且非常实操简单许多。甚至,不同Modder创建的素材也能融入到同一个游戏世界中。比如利用Omniverse跨界将Blender和Adobe Substance创建的素材同时添加进一个场景,甚至根据需要继续汇集USD通用场景描述、光线追踪、灯光道具安置、AI纹理、DLSS 3加速等等。举个例子,AI纹理工具不仅能够将原有的素材通过AI超级分辨率提升至高清素材,还将通过AI分析出材质的特征,通过调整材质属性、反光度、粗糙度等,让其更具有真实感,在不经意间让MOD拥有比原游戏更好的展现效果。在完成所有工作后,如果与游戏原作进行对比,会发现GeForce RTX 40系列GPU其实已经帮助Modder完成了大量的工作,在没有破坏游戏兴致之前,就已经能获得一个全新的重置版游戏了。有意思的是,NVIDIA Remix还不满足,还专门为Modder提供了一套场景检测工具,能够即时查看MOD的重建效果,材质效果,场景照明,后期乃至Debug,已经是一个套专业游戏开发工具的架势了。为了证明NVIDIA Remix的可行性,NVIDIA团队搬出了经典的《传送门》作为例子,通过Omniverse对游戏场景进行再构建,重置了材质贴图,增加了动态光照,并引入了光线追踪、DLSS 3和Reflex,几乎免费给G胖重新再造了一个《传送门》RTX版。比如通过Remix,玻璃运用上了透视、反射效果和折射效果,场景变得更为生动真实。通过新增粒子效果,游戏中的烟雾开始变得立体化,并考虑到光照的反射情况。这在游戏原作中是做不到的。当然V社也没想到当年的贴图,如今可以如此轻而易举变成了仿真度很高的烟雾效果。
经过一番描述,你会发现GeForce RTX 40系列GPU的硬件升级与NVIDIA Studio的布局构成了紧密的连接,从NVENC AV1双编码器应用,到利用第三代RT Core和第四代Tensor Core性能,以及DLSS 3技术,构建出了一套更高效的Omniverse创作环境。不仅如此,通过《Racer RTX》和《传送门》RTX版实打实的游戏案例,证明了NVIDIA不打算只在PPT上说说,而是亲自下场,告诉内容创作者们GeForce RTX 40的强大AI功能原来还可以这么用。很快,随着GeForce RTX 40系列开卖,前面提到的功能将会被付诸实践,这场基于NVIDIA Studio的内容创作盛宴,在大家的手中会制造出什么样天马行空的内容,无疑是最让人期待的,而我也更加期待NVIDIA 不断突破创新以追求计算图形进步的极限在哪里。