英伟达在 CES 2026 上发布新一代 Vera Rubin AI 平台

ExtremeTech • 2026年1月7日下午9:51 • IT业界

尽管英伟达此前声称今年 CES 上不会展示任何新的 GPU，但实际上它还是发布了一款全新的产品：Vera Rubin。这一面向 AI 的下一代 GPU 平台，将 Vera CPU、Rubin GPU、NVLink 6 交换芯片以及多种其他芯片整合在一起，构成了一套全新的服务器级计算架构。按照英伟达公布的数据，其性能最高可达 Blackwell 平台的 5 倍。

多年来，英伟达几乎每年都会在 CES 上发布新的游戏显卡。事实上，这是过去五年来首次没有在年初推出面向玩家的全新显卡。到了 2026 年，随着游戏业务在英伟达数据中心营收中逐渐退居次要位置，英伟达将重心明确放在了 Vera Rubin 上——这是一个专为数据中心和 AI 加速打造的平台。

在 Blackwell 硬件成功的基础上，Rubin 采用了台积电 3nm 制程，相比 Blackwell 所使用的 4nm 再次缩小了一代工艺节点。这款新 GPU 拥有 3360 亿个晶体管，并且据英伟达称，其 NVFP4 计算性能最高可达 50 PFLOPs，同样是 Blackwell 的 5 倍。

此外，新芯片还采用了更高带宽的 HBM4 显存，单颗 GPU 最大可配备 288GB 显存，总带宽最高可达 22TB/s。

与这些 GPU 搭配的是全新的 Vera CPU。该处理器基于 ARM “Olympus” 核心架构设计，自身拥有 2270 亿个晶体管，共集成 88 个核心，可支持最多 176 个并发线程。它配备了 1.5TB 的 LPDDR5X 内存，并能提供最高 1.2TB/s 的总带宽。

这一切得益于英伟达的下一代 NVLink 技术，其可为每颗 GPU 提供最高 3.6TB/s 的双向带宽，整个 NVL72 机架的总带宽更是高达惊人的 260TB/s。

所有这些设计，都是为了驱动 AI 数据中心。英伟达表示，这些全新的 GPU 和 CPU 在性能和能效方面都实现了巨大飞跃，在 AI 推理场景下，其每个 token 的成本相比 Blackwell 降低多达 10 倍；在训练任务中，所需的 token 数量也可减少至 Blackwell 的四分之一。

当然，这些数据来自英伟达官方，往往代表的是最理想的测试结果，但对于 AI 数据中心的设计者而言，这样的前景依然令人垂涎。

在发布会上展示 Vera Rubin 硬件时，英伟达 CEO 黄仁勋表示，Rubin 平台将于明年同期开始量产，甚至可能稍早一些。随着美国能源部以及众多全球客户的采购订单在手，英伟达势必会尽快将这套硬件推向市场。