AI 推理基础设施公司 Baseten 正在书写硅谷 2026 年最惊人的融资故事。据《华尔街日报》报道,这家旧金山初创公司即将完成 15 亿美元的新一轮融资,估值最高达到 130 亿美元——而此时距离其上一轮 3 亿美元 E 轮融资仅过去了五个月,估值翻了 160%。
一轮融资,两个价格
这轮融资最值得玩味的细节并非规模,而是结构。Baseten 采用了当下 AI 独角兽中流行的 split-price 机制:部分投资者按 110 亿美元估值进入,另一部分按 130 亿美元。这种设计让公司可以在对外宣传中引用更高的数字,同时为后进入或更谨慎的投资者提供更低的入场价格。
联合领投方包括 Spark Capital、Sands Capital、Altimeter Capital、Wellington Management 和 Conviction。这五家机构共同押注一个判断:AI 产业的价值正在从模型训练层向下游的推理服务层迁移。
回顾 Baseten 的融资轨迹,速度令人眩晕:
- 2025 年 9 月:D 轮 1.5 亿美元,估值 21.5 亿
- 2026 年 1 月:E 轮 3 亿美元,估值 50 亿(Nvidia 参投 1.5 亿)
- 2026 年 6 月:本轮 15 亿美元,估值 110–130 亿
从 21.5 亿到 130 亿,不到九个月,估值翻了六倍。
6 亿美元 ARR 的引擎
支撑这一估值曲线的是惊人的收入增速。据研究机构 Sacra 估计,Baseten 的年化经常性收入(ARR)从 2025 年 12 月的约 2 亿美元增长至 2026 年 3 月的约 6 亿美元——在一个季度内翻了三倍,同比增长约 1900%。
按 130 亿美元估值上限和 6 亿美元估算 ARR 计算,市销率约为 22 倍;按 110 亿下限计算则为 18 倍。相比 E 轮时的约 25 倍(5 亿估值 / 2 亿 ARR),倍数在压缩,但绝对值在飙升——投资者押注的是持续加速,而非当前收入。
需要指出的是,上述收入数据来自 Sacra 的估算,并非 Baseten 官方披露的经审计财务数据。公司未公开确认这些数字,但 SiliconANGLE 和 The Next Web 等多家媒体均援引了相近的范围。方向性趋势——陡峭、近期且加速——比精确数字本身更能解释估值逻辑。
不建模型,只建"模型的高速公路"
Baseten 的核心模式可以用一句话概括:从约 20 个云提供商租用 GPU 算力,在其上叠加自研推理软件层,帮助企业部署和微调开放模型。
与 OpenAI、Anthropic 等构建前沿模型的公司不同,Baseten 不拥有任何模型。它位于 AI 技术栈的推理层——模型训练完成后,实际回答用户查询的那一步。CEO Tuhin Srivastava 对《华尔街日报》表示:"开源模型正在变得非常、非常好,"客户越来越多地根据任务复杂度混合使用开源和闭源模型。
Baseten 的客户名单印证了这一趋势。AI 编程助手 Cursor、招聘平台 Mercor 和临床 AI 公司 OpenEvidence 都是其标杆客户。据 The Next Web 报道,有客户通过将工作负载迁移至开源模型,将推理成本降至闭源替代方案的约 30%。
在 CNBC 今年 2 月的采访中,Srivastava 曾更直白地描述这一动态:"有很多每季度向 OpenAI 和 Anthropic 支付数百万美元的公司正在思考'我怎么才能省钱?'——然后他们蜂拥而至。"
开放模型崛起:推理层的结构性顺风
Baseten 的爆发式增长并非孤例,它映射的是 AI 产业链的一次深层价值转移。
过去两年,资本和注意力集中在模型训练层——OpenAI、Anthropic、xAI 等公司筹集了数百亿美元用于训练越来越大的模型。但当 DeepSeek、Qwen、GLM、Kimi 等开放模型在性能上逼近甚至追平闭源前沿模型时,下游的推理层开始成为更大的价值捕获点。
以 DeepSeek V4 为例,其 API 定价约为每百万输入 token 0.14 美元,大约是 GPT-5 系列的二十分之一。Zhipu AI 的 GLM-5.1 在 SWE-Bench Pro 编码基准上甚至超越了 GPT-5.4 和 Claude Opus 4.6。当开放模型的质量阈值跨过"足够好"的分界线,企业自然会将推理预算从昂贵的闭源 API 转向成本更低的开放替代方案。
这正是 Baseten 的增长逻辑:它不押注哪个模型会赢,它押注模型会越来越多、越来越便宜,而企业需要一个统一的路由层来管理这种复杂性。 Srivastava 在 E 轮融资公告中写道:"如果说云是上一代伟大科技公司的基础,那么推理就是下一代的基础。"
Deloitte 2026 年技术预测显示,推理将占当年 AI 总算力的约三分之二,高于 2023 年的约三分之一和 2025 年的约一半。这是一场结构性的算力支出再分配,而 Baseten 恰好站在了水流最湍急的位置。
推理层的竞争格局:不只 Baseten 一家
Baseten 并非推理基础设施赛道的唯一玩家。整个类别正在被重新定价:
- Fireworks AI:据报道在 2026 年中寻求约 150 亿美元估值,ARR 约 8 亿美元,每天处理超过 10 万亿 token
- Together AI:据报道 ARR 已突破约 10 亿美元
- Modal Labs:以 46.5 亿美元估值完成 3 亿美元 C 轮融资
- Cerebras:推理芯片制造商,2026 年已上市
推理中间件层如今被赋予了云计算时代中间件从未达到的估值水平。"模型服务"已从一个功能升级为一个独立品类——大到足以支撑多家数百亿美元估值的公司,且各自拥有差异化定位。
但竞争也来自多个方向。一方面,OpenAI 据报道正在考虑大幅降低 API 价格以应对开放模型的冲击——如果前沿模型提供商大幅降价,开源替代方案的成本优势就会被压缩。另一方面,超大规模云厂商(AWS、Google Cloud、Azure)正在向推理服务领域投入巨资,未来可能直接提供类似的多云路由能力,侵蚀独立推理平台的利润空间。
一个悖论:靠推理降价赚钱
Baseten 面临一个根本性的张力:它的商业模式建立在推理越来越便宜的基础上,但推理价格持续下跌本身也在压缩其每 token 的收入。
根据 Epoch AI 的数据,自 2023 年以来,LLM 推理成本的中位数每年下降约 50 倍,高性能前沿的降幅更大。如果每 token 价格趋近于零,Baseten 的营收从何而来?
答案是量。当推理变得更便宜,可经济运行的 AI 应用数量呈指数级增长——更便宜的价格打开了之前不可行的场景,从而驱动总 token 消耗量以更快速度增长。这是一场"量 vs 价"的赛跑:Baseten 押注 token 总量增长的速度超过每个 token 价格下降的速度。
目前,估算的收入曲线表明这一赌注正在兑现。但核心问题在于:当每个超大规模云厂商都提供类似的多云推理服务时,Baseten 的路由和工具链能否保持足够的差异化来捍卫利润空间?这一点,130 亿美元的估值尚未充分定价。
信号意义:AI 的钱正在往下游流动
抛开融资数额本身,Baseten 这一轮传递了一个更重要的产业信号:AI 投资的重心正在从"训练模型"转向"服务模型"。
就在 Baseten 融资消息传出的同一周,SpaceX 以 600 亿美元收购了 AI 编程助手 Cursor——Baseten 的核心客户之一。DeepSeek 完成超过 74 亿美元的首轮融资。Nvidia 在 GTC 2026 上披露了 1 万亿美元的订单管道。这些信号叠加在一起,描绘出一幅清晰的图景:AI 基础设施的军备竞赛没有降温,但战场正在转移。
对于中国 AI 产业而言,这同样是一个值得关注的信号。DeepSeek、Qwen、GLM 等中国开放模型的崛起,正在成为全球推理层繁荣的关键供给端驱动力。Baseten 官网明确列出了对 DeepSeek V4、GLM 5.1、Kimi K2.6 等模型的一线支持。当中国模型成为全球推理基础设施的标准配置,整个产业链的价值分配逻辑将被重写。
截至发稿,Baseten 尚未正式宣布本轮融资完成。如果最终按报道条款交割,Baseten 的总融资额将超过 20 亿美元,成为全球资金最充裕的私有 AI 基础设施公司之一。在推理层"淘金热"的叙事中,这家卖铲子的公司正在成为最贵的铲子供应商。

