Baseten 估值 130 亿美元：推理层「淘金热」背后的 6 亿美元 ARR 与开放模型的崛起

AI 推理基础设施公司 Baseten 正在书写硅谷 2026 年最惊人的融资故事。据《华尔街日报》报道，这家旧金山初创公司即将完成 15 亿美元的新一轮融资，估值最高达到 130 亿美元——而此时距离其上一轮 3 亿美元 E 轮融资仅过去了五个月，估值翻了 160%。

一轮融资，两个价格

这轮融资最值得玩味的细节并非规模，而是结构。Baseten 采用了当下 AI 独角兽中流行的 split-price 机制：部分投资者按 110 亿美元估值进入，另一部分按 130 亿美元。这种设计让公司可以在对外宣传中引用更高的数字，同时为后进入或更谨慎的投资者提供更低的入场价格。

联合领投方包括 Spark Capital、Sands Capital、Altimeter Capital、Wellington Management 和 Conviction。这五家机构共同押注一个判断：AI 产业的价值正在从模型训练层向下游的推理服务层迁移。

回顾 Baseten 的融资轨迹，速度令人眩晕：

2025 年 9 月：D 轮 1.5 亿美元，估值 21.5 亿
2026 年 1 月：E 轮 3 亿美元，估值 50 亿（Nvidia 参投 1.5 亿）
2026 年 6 月：本轮 15 亿美元，估值 110–130 亿

从 21.5 亿到 130 亿，不到九个月，估值翻了六倍。

6 亿美元 ARR 的引擎

支撑这一估值曲线的是惊人的收入增速。据研究机构 Sacra 估计，Baseten 的年化经常性收入（ARR）从 2025 年 12 月的约 2 亿美元增长至 2026 年 3 月的约 6 亿美元——在一个季度内翻了三倍，同比增长约 1900%。

按 130 亿美元估值上限和 6 亿美元估算 ARR 计算，市销率约为 22 倍；按 110 亿下限计算则为 18 倍。相比 E 轮时的约 25 倍（5 亿估值 / 2 亿 ARR），倍数在压缩，但绝对值在飙升——投资者押注的是持续加速，而非当前收入。

需要指出的是，上述收入数据来自 Sacra 的估算，并非 Baseten 官方披露的经审计财务数据。公司未公开确认这些数字，但 SiliconANGLE 和 The Next Web 等多家媒体均援引了相近的范围。方向性趋势——陡峭、近期且加速——比精确数字本身更能解释估值逻辑。

不建模型，只建"模型的高速公路"

Baseten 的核心模式可以用一句话概括：从约 20 个云提供商租用 GPU 算力，在其上叠加自研推理软件层，帮助企业部署和微调开放模型。

与 OpenAI、Anthropic 等构建前沿模型的公司不同，Baseten 不拥有任何模型。它位于 AI 技术栈的推理层——模型训练完成后，实际回答用户查询的那一步。CEO Tuhin Srivastava 对《华尔街日报》表示："开源模型正在变得非常、非常好，"客户越来越多地根据任务复杂度混合使用开源和闭源模型。

Baseten 的客户名单印证了这一趋势。AI 编程助手 Cursor、招聘平台 Mercor 和临床 AI 公司 OpenEvidence 都是其标杆客户。据 The Next Web 报道，有客户通过将工作负载迁移至开源模型，将推理成本降至闭源替代方案的约 30%。

在 CNBC 今年 2 月的采访中，Srivastava 曾更直白地描述这一动态："有很多每季度向 OpenAI 和 Anthropic 支付数百万美元的公司正在思考'我怎么才能省钱？'——然后他们蜂拥而至。"

开放模型崛起：推理层的结构性顺风

Baseten 的爆发式增长并非孤例，它映射的是 AI 产业链的一次深层价值转移。

过去两年，资本和注意力集中在模型训练层——OpenAI、Anthropic、xAI 等公司筹集了数百亿美元用于训练越来越大的模型。但当 DeepSeek、Qwen、GLM、Kimi 等开放模型在性能上逼近甚至追平闭源前沿模型时，下游的推理层开始成为更大的价值捕获点。

以 DeepSeek V4 为例，其 API 定价约为每百万输入 token 0.14 美元，大约是 GPT-5 系列的二十分之一。Zhipu AI 的 GLM-5.1 在 SWE-Bench Pro 编码基准上甚至超越了 GPT-5.4 和 Claude Opus 4.6。当开放模型的质量阈值跨过"足够好"的分界线，企业自然会将推理预算从昂贵的闭源 API 转向成本更低的开放替代方案。

这正是 Baseten 的增长逻辑：它不押注哪个模型会赢，它押注模型会越来越多、越来越便宜，而企业需要一个统一的路由层来管理这种复杂性。 Srivastava 在 E 轮融资公告中写道："如果说云是上一代伟大科技公司的基础，那么推理就是下一代的基础。"

Deloitte 2026 年技术预测显示，推理将占当年 AI 总算力的约三分之二，高于 2023 年的约三分之一和 2025 年的约一半。这是一场结构性的算力支出再分配，而 Baseten 恰好站在了水流最湍急的位置。

推理层的竞争格局：不只 Baseten 一家

Baseten 并非推理基础设施赛道的唯一玩家。整个类别正在被重新定价：

Fireworks AI：据报道在 2026 年中寻求约 150 亿美元估值，ARR 约 8 亿美元，每天处理超过 10 万亿 token
Together AI：据报道 ARR 已突破约 10 亿美元
Modal Labs：以 46.5 亿美元估值完成 3 亿美元 C 轮融资
Cerebras：推理芯片制造商，2026 年已上市

推理中间件层如今被赋予了云计算时代中间件从未达到的估值水平。"模型服务"已从一个功能升级为一个独立品类——大到足以支撑多家数百亿美元估值的公司，且各自拥有差异化定位。

但竞争也来自多个方向。一方面，OpenAI 据报道正在考虑大幅降低 API 价格以应对开放模型的冲击——如果前沿模型提供商大幅降价，开源替代方案的成本优势就会被压缩。另一方面，超大规模云厂商（AWS、Google Cloud、Azure）正在向推理服务领域投入巨资，未来可能直接提供类似的多云路由能力，侵蚀独立推理平台的利润空间。

一个悖论：靠推理降价赚钱

Baseten 面临一个根本性的张力：它的商业模式建立在推理越来越便宜的基础上，但推理价格持续下跌本身也在压缩其每 token 的收入。

根据 Epoch AI 的数据，自 2023 年以来，LLM 推理成本的中位数每年下降约 50 倍，高性能前沿的降幅更大。如果每 token 价格趋近于零，Baseten 的营收从何而来？

答案是量。当推理变得更便宜，可经济运行的 AI 应用数量呈指数级增长——更便宜的价格打开了之前不可行的场景，从而驱动总 token 消耗量以更快速度增长。这是一场"量 vs 价"的赛跑：Baseten 押注 token 总量增长的速度超过每个 token 价格下降的速度。

目前，估算的收入曲线表明这一赌注正在兑现。但核心问题在于：当每个超大规模云厂商都提供类似的多云推理服务时，Baseten 的路由和工具链能否保持足够的差异化来捍卫利润空间？这一点，130 亿美元的估值尚未充分定价。

信号意义：AI 的钱正在往下游流动

抛开融资数额本身，Baseten 这一轮传递了一个更重要的产业信号：AI 投资的重心正在从"训练模型"转向"服务模型"。

就在 Baseten 融资消息传出的同一周，SpaceX 以 600 亿美元收购了 AI 编程助手 Cursor——Baseten 的核心客户之一。DeepSeek 完成超过 74 亿美元的首轮融资。Nvidia 在 GTC 2026 上披露了 1 万亿美元的订单管道。这些信号叠加在一起，描绘出一幅清晰的图景：AI 基础设施的军备竞赛没有降温，但战场正在转移。

对于中国 AI 产业而言，这同样是一个值得关注的信号。DeepSeek、Qwen、GLM 等中国开放模型的崛起，正在成为全球推理层繁荣的关键供给端驱动力。Baseten 官网明确列出了对 DeepSeek V4、GLM 5.1、Kimi K2.6 等模型的一线支持。当中国模型成为全球推理基础设施的标准配置，整个产业链的价值分配逻辑将被重写。

截至发稿，Baseten 尚未正式宣布本轮融资完成。如果最终按报道条款交割，Baseten 的总融资额将超过 20 亿美元，成为全球资金最充裕的私有 AI 基础设施公司之一。在推理层"淘金热"的叙事中，这家卖铲子的公司正在成为最贵的铲子供应商。