Nvidia 的 Agentic AI 基础设施赌注：Vera CPU 问世，35 台超算涌入欧洲

2026 年 6 月 22 日，汉堡。ISC High Performance 2026 大会第一天，Nvidia 扔出了两张牌——一张叫 Vera CPU，一张叫 35 台欧洲超算。单独看，每一张都足以成为当日头条；放在一起，它们共同拼出了 Nvidia 对未来 AI 基础设施的判断：Agentic AI 的下一阶段，需要的远不止更强的 GPU。

Vera CPU：不是 GPU 的配角

这不是 Nvidia 第一次做 CPU。Grace 已经证明了它在 Arm 服务器领域的野心。但 Vera 不同——Nvidia 将其定位为「全球首款专为 Agentic AI 和强化学习时代打造的处理器」。在官方表述中，Vera 不是 GPU 的配角，而是一个独立品类的 CPU 平台。

Vera 基于 88 颗 Nvidia 自研 Olympus 核心，完整兼容 Armv9.2 指令集，配备 176 线程。芯片采用第二代 SCF（Scalable Coherent Fabric）互联，提供 3.4 TB/s 的二分带宽和统一缓存架构。NVLink-C2C 芯片间接口吞吐量达到 1.8 TB/s——是前代 Grace 的两倍。据 Tom's Hardware 报道，单颗 Vera CPU 集成了约 2,270 亿颗晶体管，全芯片支持 Confidential Computing 可信执行环境。

Nvidia 宣称 Vera 在完成任务时比 x86 处理器快 1.8 倍，能效提升一倍。但真正让业界侧目的不是单芯片性能，而是它的机架级部署形态。

一台机架，22,500 个 Agent

Vera CPU Rack 是 Nvidia 此次发布中最激进的设计：一台液冷机架内集成 256 颗 Vera CPU，搭配 74 颗 BlueField-4 DPU 和 ConnectX SuperNIC 网络芯片。整机架提供高达 400 TB 的 LPDDR5 内存和 300 TB/s 的聚合内存带宽。

关键在于这台机架能做什么：它可以同时维持 22,500 个以上的独立 CPU 环境，每个环境以全性能独立运行。在 Nvidia 的叙事中，这 22,500 个环境不是虚拟机的概念，而是 22,500 个可以各自运行一个 AI Agent 的「沙盒」——用于工具调用、代码执行、强化学习评估和数据流编排。

这是 Agentic AI 时代的基础设施逻辑转折点。过去几年，数据中心的建设围绕着「如何更快地训练更大的模型」展开；现在，问题变成了「如何在推理时同时运行成千上万个 Agent，让它们互相调用、验证、迭代」。前者需要 GPU 的浮点算力密度，后者需要 CPU 的环境并发能力。Vera CPU Rack 正是为后者而生。

「OCI 计划从 2026 年开始部署数十万颗 NVIDIA Vera CPU，因为 Agentic AI 需要大规模持续性能，」Oracle Cloud Infrastructure 高级副总裁 Batta 表示。在此之前，Anthropic 和 OpenAI 已率先收到首批 Vera CPU。

一张更大的牌：35 台超算涌入欧洲

与 Vera CPU 同时发布的，是 Nvidia 在欧洲最大规模的超算扩张计划：35 台 AI 超算正在 23 个欧洲国家同步建设，覆盖国家级超算中心、AI 工厂和学术研究机构，总 AI 算力达到 800 exaflops。

具体项目包括：巴塞罗那超级计算中心的 EuroHPC AI Factory、德国巴伐利亚州的 Blue Swan（提供高达 11 exaflops 的 AI 训练性能和 22 exaflops 的 AI 推理性能）、意大利的 IT4LIA、斯图加特 HLRS 的 HammerHAI、瑞典 NAISS 的 Mimer EuroHPC AI Factory 等。这些系统将为超过 300 万名研究人员提供下一代 AI 和 HPC 基础设施。

WCCFTech 指出，这些部署主要基于 Hopper 和 Blackwell 平台，同时 Nvidia 透露 Vera Rubin 平台也已获得「强烈兴趣」。Nvidia 同时宣布，包括 Bull、Dell Technologies、GIGABYTE、HPE 和 Supermicro 在内的全球系统制造商将提供定制化高密度 Vera Rubin 超算系统，单机架可容纳最多 144 颗 GPU。

从更大的视角看，Nvidia 在 ISC 2026 上披露，其技术已驱动 TOP500 榜单中超过 400 台、占比 81% 的超级计算机，并支撑了欧洲 90% 以上的 AI 工厂建设。HPCwire 评论称，这是欧洲大陆「历史上最大规模的单年度超算资源扩张」。

Vera Rubin 的三张科学面孔

在汉堡，Nvidia 特别为 Vera Rubin 平台规划了三种面向科学计算的超算形态——Mission、Vision 和 Veritas。

Mission 面向国家安全级工作负载。Vision 搭载 Vera CPU，定位于开放科学——覆盖基础模型训练、Agentic AI 以及横跨材料科学、核能、聚变能和量子计算的复杂模拟。Veritas 则结合 Rubin GPU 与独立 Vera CPU 分区，首次将高精度科学仿真与原生 AI 推理置于同一个机架级系统中。

从性能数据看：单台 Vera Rubin 机架提供超过 7 exaflops 的 AI 性能和 5 petaflops 的原生 FP64 双精度算力。Nvidia 声称，这相当于把一台 TOP50 级别的超算塞进一组机柜。

值得注意的是 Nvidia 的「POD」理念——Vera Rubin POD 将五种不同用途的机架系统（NVL72 训练推理、Groq 3 LPX 低延迟推理、Vera CPU 大规模沙盒、BlueField-4 STX AI 原生存储、Spectrum-6 SPX 硅光子网络）组合成一个 40 机架、60 exaflops 的统一 AI 工厂。这种架构设计的核心假设是：未来的 AI 工作负载不再是单一的训练或推理流水线，而是混合了 MoE 推理、RL 评估、工具调用、长上下文记忆寻址和 Agent 间通信的多阶段并行任务图。

欧洲：Nvidia 的最大增量市场

35 台超算、23 个国家、800 exaflops——这些数字背后有一个地缘维度的故事。

过去两年，美国对华 AI 芯片出口管制不断升级，Nvidia 在中国市场的营收受到结构性挤压。与此同时，欧洲正在加速构建「主权 AI」能力——从 EuroHPC 联合计划到各国自建的 AI 工厂，欧洲对自主可控的 AI 基础设施需求快速膨胀。Nvidia 在欧洲的布局既是对市场需求的响应，也是一种地缘对冲。

Jensen Huang 在今年 3 月的 GTC 大会上曾表示：「我看到到 2027 年至少 1 万亿美元的基础设施需求。」Fortune 报道称，这个数字较此前估计翻了一倍，主要驱动力正是 Agentic AI 对推理和并发运算的爆发式需求。现在，欧洲正成为这一万亿叙事中最重要的增量市场。

一场架构层面的范式转移

Vera CPU 和欧洲超算扩张放在一起看，Nvidia 的战略清晰可见：AI 基础设施的竞争正在从「谁的 GPU 更强」转向「谁的系统架构更适合 Agent 时代」。

在训练阶段，AI 工作是相对线性的——数据进、梯度出。但在 Agent 阶段，工作负载变成了一张复杂的依赖图：一个用户请求可能触发数十个 Agent 并行运行，Agent 之间互相调用、验证输出、查询外部工具、访问存储。这要求基础设施不仅能提供峰值算力，还要能在海量并发环境中维持低延迟、高带宽和一致的数据语义。

这正是 Nvidia 投入 CPU 的原因。Vera 不是要和 AMD EPYC 或 Intel Xeon 抢夺通用服务器市场——至少短期内不是。它的真正目标是成为 Nvidia AI 工厂体系中的「Agent 运行时」：与 Rubin GPU 协同，但可独立扩展，为 Agentic AI 工作负载提供专门的 CPU 容量池。

Dell、HPE、Lenovo 和 Supermicro 已承诺量产独立 Vera CPU 服务器——这是 x86 之外首次出现标准化的 CPU 选项。连同 ASUS、Foxconn、GIGABYTE、Quanta 等代工伙伴，一个围绕 Vera 的制造生态正在成型。

结语

ISC 2026 上 Nvidia 的发布给人的感觉是：Agentic AI 不再是 PPT 概念，它已经开始定义基础设施的物理形态。256 颗液冷 CPU 塞进一个机架、22,500 个并发环境、35 台超算横跨欧洲大陆——这些数字本身不是目的，它们是 Nvidia 对「AI 下一阶段」的答案。

如果说 GPU 时代的问题是如何更快地训练，那么 Agent 时代的问题是如何更聪明地运行。Vera CPU 是 Nvidia 为这个新问题做出的第一个硬件回答。