2026 年 6 月 22 日,汉堡。ISC High Performance 2026 大会第一天,Nvidia 扔出了两张牌——一张叫 Vera CPU,一张叫 35 台欧洲超算。单独看,每一张都足以成为当日头条;放在一起,它们共同拼出了 Nvidia 对未来 AI 基础设施的判断:Agentic AI 的下一阶段,需要的远不止更强的 GPU。
Vera CPU:不是 GPU 的配角
这不是 Nvidia 第一次做 CPU。Grace 已经证明了它在 Arm 服务器领域的野心。但 Vera 不同——Nvidia 将其定位为「全球首款专为 Agentic AI 和强化学习时代打造的处理器」。在官方表述中,Vera 不是 GPU 的配角,而是一个独立品类的 CPU 平台。
Vera 基于 88 颗 Nvidia 自研 Olympus 核心,完整兼容 Armv9.2 指令集,配备 176 线程。芯片采用第二代 SCF(Scalable Coherent Fabric)互联,提供 3.4 TB/s 的二分带宽和统一缓存架构。NVLink-C2C 芯片间接口吞吐量达到 1.8 TB/s——是前代 Grace 的两倍。据 Tom's Hardware 报道,单颗 Vera CPU 集成了约 2,270 亿颗晶体管,全芯片支持 Confidential Computing 可信执行环境。
Nvidia 宣称 Vera 在完成任务时比 x86 处理器快 1.8 倍,能效提升一倍。但真正让业界侧目的不是单芯片性能,而是它的机架级部署形态。
一台机架,22,500 个 Agent
Vera CPU Rack 是 Nvidia 此次发布中最激进的设计:一台液冷机架内集成 256 颗 Vera CPU,搭配 74 颗 BlueField-4 DPU 和 ConnectX SuperNIC 网络芯片。整机架提供高达 400 TB 的 LPDDR5 内存和 300 TB/s 的聚合内存带宽。
关键在于这台机架能做什么:它可以同时维持 22,500 个以上的独立 CPU 环境,每个环境以全性能独立运行。在 Nvidia 的叙事中,这 22,500 个环境不是虚拟机的概念,而是 22,500 个可以各自运行一个 AI Agent 的「沙盒」——用于工具调用、代码执行、强化学习评估和数据流编排。
这是 Agentic AI 时代的基础设施逻辑转折点。过去几年,数据中心的建设围绕着「如何更快地训练更大的模型」展开;现在,问题变成了「如何在推理时同时运行成千上万个 Agent,让它们互相调用、验证、迭代」。前者需要 GPU 的浮点算力密度,后者需要 CPU 的环境并发能力。Vera CPU Rack 正是为后者而生。
「OCI 计划从 2026 年开始部署数十万颗 NVIDIA Vera CPU,因为 Agentic AI 需要大规模持续性能,」Oracle Cloud Infrastructure 高级副总裁 Batta 表示。在此之前,Anthropic 和 OpenAI 已率先收到首批 Vera CPU。
一张更大的牌:35 台超算涌入欧洲
与 Vera CPU 同时发布的,是 Nvidia 在欧洲最大规模的超算扩张计划:35 台 AI 超算正在 23 个欧洲国家同步建设,覆盖国家级超算中心、AI 工厂和学术研究机构,总 AI 算力达到 800 exaflops。
具体项目包括:巴塞罗那超级计算中心的 EuroHPC AI Factory、德国巴伐利亚州的 Blue Swan(提供高达 11 exaflops 的 AI 训练性能和 22 exaflops 的 AI 推理性能)、意大利的 IT4LIA、斯图加特 HLRS 的 HammerHAI、瑞典 NAISS 的 Mimer EuroHPC AI Factory 等。这些系统将为超过 300 万名研究人员提供下一代 AI 和 HPC 基础设施。
WCCFTech 指出,这些部署主要基于 Hopper 和 Blackwell 平台,同时 Nvidia 透露 Vera Rubin 平台也已获得「强烈兴趣」。Nvidia 同时宣布,包括 Bull、Dell Technologies、GIGABYTE、HPE 和 Supermicro 在内的全球系统制造商将提供定制化高密度 Vera Rubin 超算系统,单机架可容纳最多 144 颗 GPU。
从更大的视角看,Nvidia 在 ISC 2026 上披露,其技术已驱动 TOP500 榜单中超过 400 台、占比 81% 的超级计算机,并支撑了欧洲 90% 以上的 AI 工厂建设。HPCwire 评论称,这是欧洲大陆「历史上最大规模的单年度超算资源扩张」。
Vera Rubin 的三张科学面孔
在汉堡,Nvidia 特别为 Vera Rubin 平台规划了三种面向科学计算的超算形态——Mission、Vision 和 Veritas。
Mission 面向国家安全级工作负载。Vision 搭载 Vera CPU,定位于开放科学——覆盖基础模型训练、Agentic AI 以及横跨材料科学、核能、聚变能和量子计算的复杂模拟。Veritas 则结合 Rubin GPU 与独立 Vera CPU 分区,首次将高精度科学仿真与原生 AI 推理置于同一个机架级系统中。
从性能数据看:单台 Vera Rubin 机架提供超过 7 exaflops 的 AI 性能和 5 petaflops 的原生 FP64 双精度算力。Nvidia 声称,这相当于把一台 TOP50 级别的超算塞进一组机柜。
值得注意的是 Nvidia 的「POD」理念——Vera Rubin POD 将五种不同用途的机架系统(NVL72 训练推理、Groq 3 LPX 低延迟推理、Vera CPU 大规模沙盒、BlueField-4 STX AI 原生存储、Spectrum-6 SPX 硅光子网络)组合成一个 40 机架、60 exaflops 的统一 AI 工厂。这种架构设计的核心假设是:未来的 AI 工作负载不再是单一的训练或推理流水线,而是混合了 MoE 推理、RL 评估、工具调用、长上下文记忆寻址和 Agent 间通信的多阶段并行任务图。
欧洲:Nvidia 的最大增量市场
35 台超算、23 个国家、800 exaflops——这些数字背后有一个地缘维度的故事。
过去两年,美国对华 AI 芯片出口管制不断升级,Nvidia 在中国市场的营收受到结构性挤压。与此同时,欧洲正在加速构建「主权 AI」能力——从 EuroHPC 联合计划到各国自建的 AI 工厂,欧洲对自主可控的 AI 基础设施需求快速膨胀。Nvidia 在欧洲的布局既是对市场需求的响应,也是一种地缘对冲。
Jensen Huang 在今年 3 月的 GTC 大会上曾表示:「我看到到 2027 年至少 1 万亿美元的基础设施需求。」Fortune 报道称,这个数字较此前估计翻了一倍,主要驱动力正是 Agentic AI 对推理和并发运算的爆发式需求。现在,欧洲正成为这一万亿叙事中最重要的增量市场。
一场架构层面的范式转移
Vera CPU 和欧洲超算扩张放在一起看,Nvidia 的战略清晰可见:AI 基础设施的竞争正在从「谁的 GPU 更强」转向「谁的系统架构更适合 Agent 时代」。
在训练阶段,AI 工作是相对线性的——数据进、梯度出。但在 Agent 阶段,工作负载变成了一张复杂的依赖图:一个用户请求可能触发数十个 Agent 并行运行,Agent 之间互相调用、验证输出、查询外部工具、访问存储。这要求基础设施不仅能提供峰值算力,还要能在海量并发环境中维持低延迟、高带宽和一致的数据语义。
这正是 Nvidia 投入 CPU 的原因。Vera 不是要和 AMD EPYC 或 Intel Xeon 抢夺通用服务器市场——至少短期内不是。它的真正目标是成为 Nvidia AI 工厂体系中的「Agent 运行时」:与 Rubin GPU 协同,但可独立扩展,为 Agentic AI 工作负载提供专门的 CPU 容量池。
Dell、HPE、Lenovo 和 Supermicro 已承诺量产独立 Vera CPU 服务器——这是 x86 之外首次出现标准化的 CPU 选项。连同 ASUS、Foxconn、GIGABYTE、Quanta 等代工伙伴,一个围绕 Vera 的制造生态正在成型。
结语
ISC 2026 上 Nvidia 的发布给人的感觉是:Agentic AI 不再是 PPT 概念,它已经开始定义基础设施的物理形态。256 颗液冷 CPU 塞进一个机架、22,500 个并发环境、35 台超算横跨欧洲大陆——这些数字本身不是目的,它们是 Nvidia 对「AI 下一阶段」的答案。
如果说 GPU 时代的问题是如何更快地训练,那么 Agent 时代的问题是如何更聪明地运行。Vera CPU 是 Nvidia 为这个新问题做出的第一个硬件回答。
