尽管英伟达此前声称今年 CES 上不会展示任何新的 GPU,但实际上它还是发布了一款全新的产品:Vera Rubin。这一面向 AI 的下一代 GPU 平台,将 Vera CPU、Rubin GPU、NVLink 6 交换芯片 以及多种其他芯片整合在一起,构成了一套全新的服务器级计算架构。按照英伟达公布的数据,其性能最高可达 Blackwell 平台的 5 倍。

多年来,英伟达几乎每年都会在 CES 上发布新的游戏显卡。事实上,这是过去 五年 来首次没有在年初推出面向玩家的全新显卡。到了 2026 年,随着游戏业务在英伟达数据中心营收中逐渐退居次要位置,英伟达将重心明确放在了 Vera Rubin 上——这是一个专为数据中心和 AI 加速打造的平台。
在 Blackwell 硬件成功的基础上,Rubin 采用了 台积电 3nm 制程,相比 Blackwell 所使用的 4nm 再次缩小了一代工艺节点。这款新 GPU 拥有 3360 亿个晶体管,并且据英伟达称,其 NVFP4 计算性能最高可达 50 PFLOPs,同样是 Blackwell 的 5 倍。
此外,新芯片还采用了 更高带宽的 HBM4 显存,单颗 GPU 最大可配备 288GB 显存,总带宽最高可达 22TB/s。
与这些 GPU 搭配的是全新的 Vera CPU。该处理器基于 ARM “Olympus” 核心架构设计,自身拥有 2270 亿个晶体管,共集成 88 个核心,可支持 最多 176 个并发线程。它配备了 1.5TB 的 LPDDR5X 内存,并能提供 最高 1.2TB/s 的总带宽。
这一切得益于英伟达的下一代 NVLink 技术,其可为 每颗 GPU 提供最高 3.6TB/s 的双向带宽,整个 NVL72 机架 的总带宽更是高达惊人的 260TB/s。
所有这些设计,都是为了驱动 AI 数据中心。英伟达表示,这些全新的 GPU 和 CPU 在性能和能效方面都实现了巨大飞跃,在 AI 推理 场景下,其 每个 token 的成本 相比 Blackwell 降低多达 10 倍;在 训练任务 中,所需的 token 数量也可减少至 Blackwell 的 四分之一。
当然,这些数据来自英伟达官方,往往代表的是最理想的测试结果,但对于 AI 数据中心的设计者而言,这样的前景依然令人垂涎。
在发布会上展示 Vera Rubin 硬件时,英伟达 CEO 黄仁勋 表示,Rubin 平台将于 明年同期 开始量产,甚至可能稍早一些。随着 美国能源部 以及众多全球客户的采购订单在手,英伟达势必会尽快将这套硬件推向市场。