企业 AI 支出撞上 ROI 之墙：Uber 一季度烧完全年预算，Sam Altman 称行业正经历「严重收缩」

2026 年初，硅谷最时髦的词是 「tokenmaxxing」——CEO 们鼓励员工像没有明天一样使用 AI，内部排行榜上谁的 token 消耗量最大，谁就是英雄。Sam Altman 在 OpenAI 内部甚至把 token 消耗做成了游戏化 leaderboard，员工在社交媒体上炫耀自己的使用量。

半年后，账单来了。

在 6 月初 OpenAI 举办的「Intelligence at Work」企业活动上，Altman 发出了一个令整个行业警醒的信号：AI 支出正在经历「严重收缩」。他坦言，2026 年初客户对 AI 预算「从未提出过任何顾虑」，而仅仅几个月后，平衡 AI 预算已经突然变成了「一个巨大的问题」——足以威胁到云厂商和终端用户的盈利能力。

这不是一个孤立的声音。Uber 在今年 4 月就用完了全年的 AI 预算。据 The Information 报道，Uber 首席技术官 Praveen Neppalli Naga 承认公司已「回到画板前」重新规划。微软取消了对大部分开发者的 Claude Code 许可。亚马逊关闭了内部 token 排行榜。Priceline 的一名员工告诉 TechCrunch，一次常规的 Cursor 合同续约，价格涨了 4 到 5 倍。

从「tokenmaxxing」到预算危机，AI 行业正在经历一场剧烈的现实检验。

Tokenmaxxing：一场硅谷自导自演的狂欢

「tokenmaxxing」这个词最早出现在 2026 年初的硅谷开发者圈，它描述的是一种极致行为：以最大化 token 消耗量为目标来使用 AI 工具。在这个逻辑下，用 AI 用得越多，意味着你越「先进」、越「AI-native」。Uber 在内部设立了按团队排名的 AI 使用排行榜，鼓励员工「尽可能多地使用 AI」。OpenAI 内部同样如此——Altman 透露，公司内部排名第一的 token 消耗者现在每月使用约 1000 亿 token，而六年前，这个数字仅仅是 10 万。

但 token 消耗量从来不是生产率指标。它是成本指标。

TechCrunch 今年 4 月的一篇报道标题已经点破了问题：「Tokenmaxxing 让开发者的生产力低于他们的想象」。文章援引 GitClear 的数据指出，频繁使用 AI 的开发者，其代码改动率（churn）比不使用 AI 的同行高出 9.4 倍——远超过 AI 工具带来的生产力提升。Faros AI 对两年客户数据的分析发现，高 AI 采用率下，代码改动率暴增 861%。Jellyfish 在对 7,548 名工程师的研究中得出一个刺眼的结论：token 消耗最高的工程师产出确实翻倍了——但他们的 token 成本是 10 倍。

「用两倍的吞吐量换十倍的 token 成本」，Jellyfish 研究负责人 Nicholas Arcolano 总结道，「极端支出是否值得，取决于最终交付代码的商业价值，而大多数公司目前还无法衡量它。」

Uber：教科书级的预算失控

Uber 的案例将成为商学院未来几年反复引用的 AI 预算管理反面教材。

2025 年 12 月，Uber 向大约 5,000 名工程师推出 Anthropic 的 Claude Code。到 2026 年春天，95% 的 Uber 工程师每月使用 AI 工具，约 70% 的提交代码来自 AI 工具。从工程采用的角度看，这是一次教科书级的成功推广。从财务角度看，这是一场灾难。

据 Forbes 报道，Uber 在 2025 年的研发支出为 34 亿美元，同比增长 9%。但 AI 支出失控的关键不在于预算规模，而在于基于 token 的消费定价模型完全超出了企业财务团队理解和管理的能力。每月每个工程师的 AI 支出在 $500 到 $2,000 之间，重度用户甚至更高。当 CFO 习惯用固定许可证成本来做预算模型时，token 消耗像一个没有阀门的水龙头。

6 月初，Uber 被迫实施硬性限制：每个员工、每个 AI 编码工具每月 $1,500 的支出上限，通过内部仪表盘追踪，超出限额需特批。Uber 总裁兼 COO Andrew Macdonald 在 Fortune 的 Rapid Response 播客中直言：「很难在这些统计数据和『好的，我们现在确实多交付了 25% 的有用消费者功能』之间画一条线。这种联系还不存在。」

「如果你无法直接画出 AI 使用量与交付给用户的功能数量之间的连线，这种交易就越来越难自圆其说。」Macdonald 说。

Uber 并不孤单。据 The Verge 报道，微软也取消了大部分直接 Claude Code 许可，转向 GitHub Copilot CLI。一家公司甚至被曝在忘记设置使用限制后，收到了一张 5 亿美元的 Claude 账单。

「基础设施在暴增，应用层 ROI 还没来」

这或许是整个故事中最矛盾的部分。

在应用层哀鸿遍野的同时，云基础设施的需求正在以史无前例的速度增长。 根据 Dell'Oro Group 的数据，2025 年全球数据中心资本支出增长 57%，达到 7,260 亿美元，预计 2026 年将突破 1 万亿美元。

三大云厂商的积压合同（backlog / RPO）数字令人瞠目：

AWS：积压合同 $2,440 亿，同比增长 40%。Andy Jassy 宣布 2026 年资本支出约 $2,000 亿，其中绝大部分投向 AWS。他在财报电话会上说：「需求非常强劲，无论是在 AI 领域还是在核心 AWS 领域。」
Google Cloud：Q1 2026 积压合同翻倍至 $4,620 亿。Google Cloud 该季度收入首次突破 $200 亿，同比增长 63%。CEO Sundar Pichai 称「企业 AI 解决方案首次成为云业务的主要增长引擎」。
微软：商业剩余履约义务（RPO）达到 $6,270 亿，同比增长 99%。2026 年资本支出计划约 $1,900 亿，其中 $250 亿归因于组件价格通胀。

四大云厂商（Amazon、Google、Meta、Microsoft）2026 年合计资本支出预计接近 $7,250 亿。波士顿咨询公司对 2,400 名高管的调查显示，超过 90% 的 CEO 表示即使 AI 投资在未来一年内不会产生回报，他们也会继续维持或增加投入。

那么问题出在哪里？基础设施的「需求」是真实的，但它主要来自 AI 模型训练和推理的算力订单——而不是来自企业应用层已经验证了 ROI 的预算。 用一句话概括：云厂商在卖铲子，但淘金者还没找到金子。

Altman 的预警与即将到来的 IPO 压力

Altman 的警告之所以引起震动，不仅因为它的内容，更因为它来自 AI 行业最大的受益者之一。

在 OpenAI 的企业活动上，Altman 承认了一个流行于业内的 meme：「我的公司 Q1 就花完了全年 AI 预算，你能让它更高效吗？」他承诺 OpenAI 正在「积极推动模型以更少的支出提供更多价值」——这句话本身就暗示了模型厂商已经感受到了来自客户的压力。

Techstrong.ai 的报道指出，这对 OpenAI 和 Anthropic 尤其麻烦，因为两家公司都预计在今年 IPO，即将面临华尔街对盈利能力的严苛审视。Anthropic 总裁 Daniela Amodei 表示，高昂的模型创建成本正迫使公司从公开市场寻求资金。Anthropic 最近在一轮融资中筹集了 650 亿美元，并已向 SEC 提交了 IPO 申请文件。

与此同时，OpenAI 企业业务负责人 Alexander Embiricos 在纽约的一场活动上对 TechCrunch 表示：「六个月前，我和客户的对话全是关于『它能做什么？它够好吗？』。现在我们的对话变成了『嘿，我们花了这么多钱，你们有什么可见性？有什么审计能力？有什么 token 控制？你们的模型效率如何？』」

Linux 基金会旗下的 FinOps 基金会执行董事 J.R. Storment 的话更直白：「今年 4、5 月，我开始接到公司电话说：『天哪，我们 2026 年的 token 预算已经超了 3 倍，现在才 4 月』。整个对话从 tokenmaxxing 和『快点上』，变成了『我们需要护栏，怎么控制？』」

这不是 AI 退潮，而是「从试点到生产」的阵痛

PolyAI CEO Nikola Mrkšić 的判断可能是最精准的：AI 的试点阶段已经结束，企业开始要求 ROI。 AppDirect 首席技术官 Andy Sen 说得更具体：「很多公司到处开启 AI 功能，骑着生产力浪潮前进，直到被一张巨额账单打醒。」

一些关键数据佐证了「这并非退潮而是转型」的判断：

Goldman Sachs 预测全球 token 使用量到 2030 年将增长 24 倍。
Gartner 预测 2026 年 AI 代理软件支出将达到近 $2,070 亿，较 2025 年的 $864 亿增长 139%。
尽管 token 单价在下降，但代理式 AI 工作流所需的 token 数量远超传统模型调用——Gartner 预计到 2030 年高性能模型的推理成本将下降 90%，但总支出不会下降，因为用量在激增。

在工具层面，一个全新的市场正在形成。Linux 基金会本周宣布成立 Tokenomics Foundation，旨在为 AI token 建立类似 FinOps 的成本管理体系。Datadog、New Relic、Ramp 等公司纷纷推出 AI 支出监控功能。NEA 合伙人 Tiffany Luck 在 TechCrunch Equity 播客中指出，token 效率和可观测性将成为「AI 基础设施层的关键组件」。

Vitaly Gordon（Faros AI CEO）的总结值得深思：「也许我们造出了蒸汽机，但我们还没搞明白流水线怎么搭。」

Jellyfish 的 Arcolano 给出了一个务实建议：「最好的 ROI 来自将广大的中间用户从低使用量推向中等使用量，而不是把重度用户推得更高。」这或许是当下 AI 行业最需要听到的一句话——不是更少地使用 AI，而是更聪明地使用它。

AI 的「敞口喝」时代已经结束。现在，每一口都要算账。