亚马逊 Trainium 芯片外销：一场蓄谋已久的 Nvidia 挑战

2026 年 6 月 18 日，一条消息震动了 AI 芯片市场：据 Bloomberg 与 TechCrunch 报道，AWS 正在与多家第三方数据中心运营商谈判，计划将自研的 Trainium AI 训练芯片直接出售给外部客户。这意味着亚马逊不再满足于在自家云平台上使用这些芯片——它要成为 Nvidia 的直接竞争对手。

这不是一次试探，而是一场蓄谋已久的攻势。亚马逊 CEO Andy Jassy 已将这一机会定性为 500 亿美元的市场。对于一个年数据中心芯片采购额高达数百亿美元的超大规模云厂商而言，从芯片消费者变为芯片供应商，堪称历史性转折。

从 Graviton 到 Trainium：十年磨一剑

亚马逊的自研芯片之路并非始于 AI。2015 年，亚马逊以约 3.5 亿美元收购了以色列芯片设计公司 Annapurna Labs，这成为其芯片野心的起点。2018 年，AWS 推出了首款自研 ARM 架构服务器 CPU——Graviton，主打高性价比通用计算。Graviton 的成功超出了预期：到 2024 年，AWS 超过 50% 的新增 CPU 实例已运行在 Graviton 上，Snowflake 更在 2026 年 5 月签署了价值 60 亿美元、与 Graviton 芯片绑定的五年期 AWS 合同。

Graviton 证明了 AWS 不仅能做芯片，还能让外部客户买单。这为 Trainium 的「外销」提供了信心基础。

Trainium 是 AWS 专为 AI 训练设计的芯片。第一代 Trainium 于 2021 年发布，Trainium2 于 2023 年底亮相，而最新的 Trainium3 在机架级性能上首次与 Nvidia 的旗舰产品 Blackwell NVL72 持平——这不再是一个追赶者的姿态，而是正面竞争。

为何现在决定外销？三个因素叠加：

需求爆炸：AI 训练算力需求远超供给，客户对 Nvidia 替代方案极度渴望。Pinterest 在 2026 年 6 月已承诺使用 Trainium 芯片驱动其视觉发现引擎，并签署了价值 40 亿美元的 AWS 合同。
产能到位：经过三代迭代，Trainium 的供应链和量产能力已成熟到可以支撑外部销售。
战略窗口：Nvidia 的 GPU 交付周期长、价格高企，客户愿意尝试替代方案，这是 AWS 切入的最佳时机。

硬件追平了，但 CUDA 才是真正的护城河

Trainium3 在机架级性能上与 Blackwell NVL72 持平，这是一个值得重视的里程碑。但硬件性能只是故事的一半。

Nvidia 真正的护城河不是芯片，而是 CUDA。经过近二十年的积累，CUDA 已从一个 GPU 编程接口演变为包含数万库函数、数百个加速库、完善的调试与优化工具的完整软件栈。全球数百万 AI 开发者接受的第一课就是 CUDA 编程，几乎所有主流深度学习框架（PyTorch、TensorFlow、JAX）都在 CUDA 上运行得最成熟。

AWS 的应对策略是 Neuron SDK——一套为 Trainium 和 Inferentia 芯片定制的软件开发工具包，支持 PyTorch 和 JAX 等主流框架。AWS 的策略不是与 CUDA 正面对抗，而是通过编译器优化和框架集成，让开发者用最低的迁移成本就能在 Trainium 上运行模型。对于大多数使用标准模型架构的客户而言，这一路径正在变得可行。

但不可否认：当一家初创公司需要最新的 CUDA 特性、或者需要运行完全定制化的算子时，Trainium 暂时还无法替代 Nvidia GPU。Nvidia 的数据中心业务年收入高达 1150 亿美元，这个数字本身就是 CUDA 生态护城河厚度最直观的度量。

超大规模云厂商的芯片军备竞赛

亚马逊并非唯一一个试图打破 Nvidia 垄断的超大规模云厂商。

Google 的 TPU（Tensor Processing Unit）比 Trainium 更早起步——第一代 TPU 早在 2015 年就已内部部署。2026 年 5 月，Google 与 Blackstone 宣布合资成立 TPU 云服务商，Google 持有少数股权并提供 TPU 硬件。这意味着 Google 也在将 TPU 作为独立产品推向更广阔的市场，而非仅限 Google Cloud 内部使用。

至此，三大美国超大规模云厂商的芯片战略分野已然清晰：

Nvidia：独立芯片供应商，凭借 CUDA 生态和全栈方案，牢牢占据 80% 以上的 AI 芯片市场份额。
AWS：从 Graviton 到 Trainium，从自用到外销，试图以「云+芯片」垂直整合优势，蚕食 Nvidia 的市场份额。
Google Cloud：TPU 通过合资公司独立运营，试图在云服务之外开辟芯片销售的第二战场。

Microsoft 目前尚未推出自研 AI 训练芯片，但已在自研推理芯片（Maia）上投入，未来进入训练芯片领域只是时间问题。

真正的变量

Trainium 外销能否成功，取决于三个关键变量：

第一，迁移成本。 如果 Neuron SDK 能让客户以极低的代码修改量将模型从 CUDA 迁移到 Trainium，AWS 就有机会。目前来看，对于标准 Transformer 架构的模型，这一路径已经相对顺畅；但对于非标准架构或需要极致性能优化的场景，CUDA 仍不可替代。

第二，定价策略。 AWS 并不需要 Trainium 在绝对性能上超越 Nvidia——它只需要在性价比上胜出。如果 Trainium 能以 Nvidia GPU 60%–70% 的价格提供 90% 的性能，大量对成本敏感的企业客户将难以抗拒。

第三，生态绑定。 一旦客户深度使用 Trainium 和 Neuron SDK，他们也将更深度地绑定在 AWS 云生态中。这是 AWS 芯片战略的深层逻辑：芯片外销不仅是收入来源，更是客户获取和留存的杠杆。

从芯片消费者到芯片供应商，AWS 正在改写 AI 芯片产业的游戏规则。Nvidia 的 1150 亿美元数据中心帝国不会在一夜之间动摇，但竞争格局已经不可逆转地改变了。

从 Graviton 到 Trainium：十年磨一剑

硬件追平了，但 CUDA 才是真正的护城河

超大规模云厂商的芯片军备竞赛

真正的变量

来源

评论