NVIDIA 50 系显卡评测与图形学前瞻分析

1,169次阅读
一条评论

共计 1970 个字符,预计需要花费 5 分钟才能阅读完成。

作者:橘花 Kikka(双层芝士汉堡)

1. 工艺分析

对新工艺 TSMC 定制 N4 的单片 die 的成本计算,以及对比 3090,4090 的晶圆成本比重变化:假设缺陷概率为 0.09,(纵横)划道宽度 100 微米,单片 Wafer 直径为 13 inch(N4 节点初期,12 英寸为主流尺寸),单片 Wafer 价格为 18K$,稼动率为 80%。

本段内容多援引自外网 Tom Hardware,具体数值及计算结果仅供参考。

NVIDIA 50 系显卡评测与图形学前瞻分析

5090 单片 die=18000÷45 Good die 数量÷80% 稼动率×1.1(PCM 封装测试占用 Wafer 以及封装测试等的人工成本)≈550$≈4026¥

NVIDIA 50 系显卡评测与图形学前瞻分析

4090 单片 die=17500÷48÷80%×1.1=501$

NVIDIA 50 系显卡评测与图形学前瞻分析

3090 单片 die=8000÷42÷80%×1.1=262$(由于 8nm 实属于 10nm 的改良节点,此处 Wafer 报价是由 TSMC 10nm 报价 5994$推导出的)

即 3090/4090/5090 晶圆成本占首发价的比值分别为 17%/31%/27.5%,线性拟合总体看涨,不过鉴于 Nv 在 40 系以后的利润主要集中在中端显卡上,与此相对的,30 系及 30 系以前的中端显卡性价比的代际差距却巨大无比,50 系软件开发成本均摊部分较大等等缘故的对冲,我便姑且看作近三代迭代溢价率只是小有提升好了。

2. 硬件规格,正式版驱动的性能小览

NVIDIA 50 系显卡评测与图形学前瞻分析

NVIDIA 50 系显卡评测与图形学前瞻分析

NVIDIA 50 系显卡评测与图形学前瞻分析

图片来源为 B 站 @51972

3.DLSS 4 Trasformer/CNN(卷积神经网络)详解

今年可以说是 Transformer 的元年了,其核心原理在于输入有别于 CNN 的序列性数据,通过自注意力机制和多头注意力机制来生成高分辨率的图片。此外,由于 Transformer 的计算效率在 24 年得到有效解决(此处主要指的是选择性状态空间模型 Mamba),结合它本身的跨模态适应性。除了图形学领域,其他领域的 ai 产品也有望看见 Transformer 的高速普及。

Transformer 相较于 CNN 的主要优势在于其能够通过自注意力机制获取到距离更远,更全面的当前帧的上下文信息,继而更好的处理这些元素间的关系以及它们本身。与之相对的是 CNN 的上下文采集就只能限于局部了。

注意力机制虽然也可以被看作是 CNN 中的池化层,但相较来说更加动态,有利于在处理和 output 帧中保留更多的重要信息。

在 Nvidia 官方 Demo 中,Transformer 相对于 CNN 的效果,在法线贴图和复杂形状元素等有一定改良,这些大小上远小于卷积核的元素在 CNN 方案上由于 Scale 和步长一致性以及感受野过大等原因而被稀释,故而效果不佳。(经典 CNN 中卷积核采集一般是步长一致的,鉴于 Nv 并没有给出详细的技术资料,此处待定)例如通风格栅,铁栅栏,动画水之类的,往常容易产生错误像素的复杂图形元素,在 Transfomer 方案上会有长足的进步。

NVIDIA 50 系显卡评测与图形学前瞻分析

NVIDIA 50 系显卡评测与图形学前瞻分析

4. AI 光流帧生成,Neruo Material(神经纹理)

1. 以往 DLSS3 的光流法补帧会将原本需要送显的当前帧和历史帧进行像素的矢量对比,求出生成帧,个人认为这种方法已经比手机上的独显芯片的像素取块再对比的补帧法质量高出一大截了,然而由于其本身仍然需要占用光栅化算力的缘故,这种补帧实在难称实用。

所以,我非常欣赏 AI 光流的一点是它相较于 DLSS3 来说降低了光栅化算力开销以及节约了原 OFA 的晶圆面积(并且使得没有 OFA 的老卡也有了支持插帧的可能),新范式允许插帧复用超分时的鉴权结果,计算权重分布来计算被插帧物体的关键特征,同以往所有 DLSS 技术一样运作在画面的后处理阶段(传统渲染完毕到送显前)。

尽管该技术宣称一次推理多帧生成,但是使用在非正式版驱动中,×4 以及×2 模式下的原始帧率仍然呈约 10% 的逐级递减,高倍帧生成的开销还有待观望。

2. 神经纹理是一项作用于建模着色阶段的新技术,由开发者通过 Nv 官方提供的套件将纹理材质压缩至原大小的约四分之一,在着色阶段由 AI 模型进行推理还原并且还能顺带通过入射光的亮度角度等信息推理该纹理总体的高光分布以及每一个像素点应该着什么色,原传统 Shader 则在新的管线中起到传统参数 - 张量参数的转换作用而非求解 brdf 积分。

NVIDIA 50 系显卡评测与图形学前瞻分析

NVIDIA 50 系显卡评测与图形学前瞻分析

该技术不仅仅解放了纹理占用的大量显存,以及缓解了显存流量的压力,改善纹理的光线动态变化等,也和前文提到的技术一样有利于节约 Shader 占用的传统算力,有助于在光栅化以及光栅化+RT 的混合工况下提高性能(纯 RT 工况就难说咯)。

总结来说,CES2025 更像是一场图形学技术发布会,50 系本身的光栅性能进步并不大,现有的性能进步几乎都是软件的进步,且溢价率小有提升。

软件革新也是革新,不看好 AI 管线的人和当初不看好计算摄影的人是同一个性质,只能说 50 系本身并没有太多的硬件性限制并且下放了足够多的新技术给老卡,不逼用户买新卡就是好文明!

本篇评测版权归图拉丁 Club 所有,如需转载请注明出

正文完
 3
橘花Kikka
版权声明:本站原创文章,由 橘花Kikka 2025-01-25发表,共计1970字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(一条评论)
nzbz
2025-03-10 12:21:21 回复

现在论坛没有登陆入口了吗

 Windows  Chrome