2026 年初,硅谷最时髦的词是 「tokenmaxxing」——CEO 们鼓励员工像没有明天一样使用 AI,内部排行榜上谁的 token 消耗量最大,谁就是英雄。Sam Altman 在 OpenAI 内部甚至把 token 消耗做成了游戏化 leaderboard,员工在社交媒体上炫耀自己的使用量。
半年后,账单来了。
在 6 月初 OpenAI 举办的「Intelligence at Work」企业活动上,Altman 发出了一个令整个行业警醒的信号:AI 支出正在经历「严重收缩」。他坦言,2026 年初客户对 AI 预算「从未提出过任何顾虑」,而仅仅几个月后,平衡 AI 预算已经突然变成了「一个巨大的问题」——足以威胁到云厂商和终端用户的盈利能力。
这不是一个孤立的声音。Uber 在今年 4 月就用完了全年的 AI 预算。据 The Information 报道,Uber 首席技术官 Praveen Neppalli Naga 承认公司已「回到画板前」重新规划。微软取消了对大部分开发者的 Claude Code 许可。亚马逊关闭了内部 token 排行榜。Priceline 的一名员工告诉 TechCrunch,一次常规的 Cursor 合同续约,价格涨了 4 到 5 倍。
从「tokenmaxxing」到预算危机,AI 行业正在经历一场剧烈的现实检验。
Tokenmaxxing:一场硅谷自导自演的狂欢
「tokenmaxxing」这个词最早出现在 2026 年初的硅谷开发者圈,它描述的是一种极致行为:以最大化 token 消耗量为目标来使用 AI 工具。在这个逻辑下,用 AI 用得越多,意味着你越「先进」、越「AI-native」。Uber 在内部设立了按团队排名的 AI 使用排行榜,鼓励员工「尽可能多地使用 AI」。OpenAI 内部同样如此——Altman 透露,公司内部排名第一的 token 消耗者现在每月使用约 1000 亿 token,而六年前,这个数字仅仅是 10 万。
但 token 消耗量从来不是生产率指标。它是成本指标。
TechCrunch 今年 4 月的一篇报道标题已经点破了问题:「Tokenmaxxing 让开发者的生产力低于他们的想象」。文章援引 GitClear 的数据指出,频繁使用 AI 的开发者,其代码改动率(churn)比不使用 AI 的同行高出 9.4 倍——远超过 AI 工具带来的生产力提升。Faros AI 对两年客户数据的分析发现,高 AI 采用率下,代码改动率暴增 861%。Jellyfish 在对 7,548 名工程师的研究中得出一个刺眼的结论:token 消耗最高的工程师产出确实翻倍了——但他们的 token 成本是 10 倍。
「用两倍的吞吐量换十倍的 token 成本」,Jellyfish 研究负责人 Nicholas Arcolano 总结道,「极端支出是否值得,取决于最终交付代码的商业价值,而大多数公司目前还无法衡量它。」
Uber:教科书级的预算失控
Uber 的案例将成为商学院未来几年反复引用的 AI 预算管理反面教材。
2025 年 12 月,Uber 向大约 5,000 名工程师推出 Anthropic 的 Claude Code。到 2026 年春天,95% 的 Uber 工程师每月使用 AI 工具,约 70% 的提交代码来自 AI 工具。从工程采用的角度看,这是一次教科书级的成功推广。从财务角度看,这是一场灾难。
据 Forbes 报道,Uber 在 2025 年的研发支出为 34 亿美元,同比增长 9%。但 AI 支出失控的关键不在于预算规模,而在于基于 token 的消费定价模型完全超出了企业财务团队理解和管理的能力。每月每个工程师的 AI 支出在 $500 到 $2,000 之间,重度用户甚至更高。当 CFO 习惯用固定许可证成本来做预算模型时,token 消耗像一个没有阀门的水龙头。
6 月初,Uber 被迫实施硬性限制:每个员工、每个 AI 编码工具每月 $1,500 的支出上限,通过内部仪表盘追踪,超出限额需特批。Uber 总裁兼 COO Andrew Macdonald 在 Fortune 的 Rapid Response 播客中直言:「很难在这些统计数据和『好的,我们现在确实多交付了 25% 的有用消费者功能』之间画一条线。这种联系还不存在。」
「如果你无法直接画出 AI 使用量与交付给用户的功能数量之间的连线,这种交易就越来越难自圆其说。」Macdonald 说。
Uber 并不孤单。据 The Verge 报道,微软也取消了大部分直接 Claude Code 许可,转向 GitHub Copilot CLI。一家公司甚至被曝在忘记设置使用限制后,收到了一张 5 亿美元的 Claude 账单。
「基础设施在暴增,应用层 ROI 还没来」
这或许是整个故事中最矛盾的部分。
在应用层哀鸿遍野的同时,云基础设施的需求正在以史无前例的速度增长。 根据 Dell'Oro Group 的数据,2025 年全球数据中心资本支出增长 57%,达到 7,260 亿美元,预计 2026 年将突破 1 万亿美元。
三大云厂商的积压合同(backlog / RPO)数字令人瞠目:
- AWS:积压合同 $2,440 亿,同比增长 40%。Andy Jassy 宣布 2026 年资本支出约 $2,000 亿,其中绝大部分投向 AWS。他在财报电话会上说:「需求非常强劲,无论是在 AI 领域还是在核心 AWS 领域。」
- Google Cloud:Q1 2026 积压合同翻倍至 $4,620 亿。Google Cloud 该季度收入首次突破 $200 亿,同比增长 63%。CEO Sundar Pichai 称「企业 AI 解决方案首次成为云业务的主要增长引擎」。
- 微软:商业剩余履约义务(RPO)达到 $6,270 亿,同比增长 99%。2026 年资本支出计划约 $1,900 亿,其中 $250 亿归因于组件价格通胀。
四大云厂商(Amazon、Google、Meta、Microsoft)2026 年合计资本支出预计接近 $7,250 亿。波士顿咨询公司对 2,400 名高管的调查显示,超过 90% 的 CEO 表示即使 AI 投资在未来一年内不会产生回报,他们也会继续维持或增加投入。
那么问题出在哪里?基础设施的「需求」是真实的,但它主要来自 AI 模型训练和推理的算力订单——而不是来自企业应用层已经验证了 ROI 的预算。 用一句话概括:云厂商在卖铲子,但淘金者还没找到金子。
Altman 的预警与即将到来的 IPO 压力
Altman 的警告之所以引起震动,不仅因为它的内容,更因为它来自 AI 行业最大的受益者之一。
在 OpenAI 的企业活动上,Altman 承认了一个流行于业内的 meme:「我的公司 Q1 就花完了全年 AI 预算,你能让它更高效吗?」他承诺 OpenAI 正在「积极推动模型以更少的支出提供更多价值」——这句话本身就暗示了模型厂商已经感受到了来自客户的压力。
Techstrong.ai 的报道指出,这对 OpenAI 和 Anthropic 尤其麻烦,因为两家公司都预计在今年 IPO,即将面临华尔街对盈利能力的严苛审视。Anthropic 总裁 Daniela Amodei 表示,高昂的模型创建成本正迫使公司从公开市场寻求资金。Anthropic 最近在一轮融资中筹集了 650 亿美元,并已向 SEC 提交了 IPO 申请文件。
与此同时,OpenAI 企业业务负责人 Alexander Embiricos 在纽约的一场活动上对 TechCrunch 表示:「六个月前,我和客户的对话全是关于『它能做什么?它够好吗?』。现在我们的对话变成了『嘿,我们花了这么多钱,你们有什么可见性?有什么审计能力?有什么 token 控制?你们的模型效率如何?』」
Linux 基金会旗下的 FinOps 基金会执行董事 J.R. Storment 的话更直白:「今年 4、5 月,我开始接到公司电话说:『天哪,我们 2026 年的 token 预算已经超了 3 倍,现在才 4 月』。整个对话从 tokenmaxxing 和『快点上』,变成了『我们需要护栏,怎么控制?』」
这不是 AI 退潮,而是「从试点到生产」的阵痛
PolyAI CEO Nikola Mrkšić 的判断可能是最精准的:AI 的试点阶段已经结束,企业开始要求 ROI。 AppDirect 首席技术官 Andy Sen 说得更具体:「很多公司到处开启 AI 功能,骑着生产力浪潮前进,直到被一张巨额账单打醒。」
一些关键数据佐证了「这并非退潮而是转型」的判断:
- Goldman Sachs 预测全球 token 使用量到 2030 年将增长 24 倍。
- Gartner 预测 2026 年 AI 代理软件支出将达到近 $2,070 亿,较 2025 年的 $864 亿增长 139%。
- 尽管 token 单价在下降,但代理式 AI 工作流所需的 token 数量远超传统模型调用——Gartner 预计到 2030 年高性能模型的推理成本将下降 90%,但总支出不会下降,因为用量在激增。
在工具层面,一个全新的市场正在形成。Linux 基金会本周宣布成立 Tokenomics Foundation,旨在为 AI token 建立类似 FinOps 的成本管理体系。Datadog、New Relic、Ramp 等公司纷纷推出 AI 支出监控功能。NEA 合伙人 Tiffany Luck 在 TechCrunch Equity 播客中指出,token 效率和可观测性将成为「AI 基础设施层的关键组件」。
Vitaly Gordon(Faros AI CEO)的总结值得深思:「也许我们造出了蒸汽机,但我们还没搞明白流水线怎么搭。」
Jellyfish 的 Arcolano 给出了一个务实建议:「最好的 ROI 来自将广大的中间用户从低使用量推向中等使用量,而不是把重度用户推得更高。」这或许是当下 AI 行业最需要听到的一句话——不是更少地使用 AI,而是更聪明地使用它。
AI 的「敞口喝」时代已经结束。现在,每一口都要算账。

