如果说 2025 年是「全员 AI」的狂欢之年,那么 2026 年夏天正在成为这场派对的散场时刻。企业级 AI 预算正在经历一场史无前例的信任危机——而危机的起点,竟然是一群普通员工把 token 用在了「把 PDF 转成 PPT」上。
一份泄露录音,揭开了 AI 预算的黑洞
6 月 27 日,独立科技媒体 404 Media 发布了一份获得独家渠道的 Accenture 内部会议录音。录音中,Accenture 的 Agentic AI 战略负责人 Justice Kwak 向同事们抛出了一个令人瞠目的发现:
"我们从内部数据中看到,推动 token 消耗的其实不是我们的工程师,而是大量的非技术人员——他们在做一些你们刚才讨论的行为……"
Kwak 所指的「行为」包括:把 PDF 转换成 PowerPoint 幻灯片、美化会议纪要、用高级模型写内部邮件——这些任务无一例外地使用了最昂贵的大模型 API,每次操作消耗的 token 数以万计甚至十万计。
Kwak 在录音中直言:"我们正处在一个转折点上,AI 正在成为成本结构中的实质性构成。支出变得非常不可预测,而领导层——尤其是 CFO、COO 和 CIO 级别——仍然在追问一个根本问题:我们花在 AI 上的钱,到底值不值?"
Accenture 正在为此开发一款名为 Token IQ 的内部产品,试图为客户企业提供 token 消费的可见性。讽刺的是,一家全球顶级咨询公司需要专门造一个工具来解决「钱花到哪儿去了」这个问题,本身就说明了事态的严重程度。
四个月烧光全年预算:Uber 打响限流第一枪
Accenture 的内部录音并非孤例。就在几周前,Uber CTO 向外界承认:公司在 2026 年前四个月就花光了全年的 AI 预算。
根据 TechCrunch 和 Bloomberg 的报道,Uber 随后紧急出台了硬性限制:每位员工每月在每个 Agentic 编码工具(包括 Anthropic 的 Claude Code 和 Cursor)上的 token 消费不得超过 1,500 美元。Uber 发言人向 Bloomberg 确认了这一政策——这意味着一个工程师即使同时在多个工具上工作,每项工具的月预算也是各自独立的硬上限。
Uber 的数据提供了更具象的画面:公司 95% 的工程师每月使用 AI 工具,70% 的提交代码源自 AI 生成,每位工程师的月均 AI 成本在 500 到 2,000 美元之间。当这个数字乘以数千名工程师再乘以数月,预算爆表几乎是必然的。
Walmart 跟进:连内部工具也要配给 token
紧随其后的是零售巨头 Walmart。根据 Bloomberg 的报道,Walmart 开始对内部 AI 工具 Code Puppy 实施 token 配额制度。这款工具此前对全体员工提供无限量 token,可协助完成从电子表格处理到演示文稿制作的各种任务。现在,每位员工只能使用固定数量的 token。
Walmart CEO John Furner 对此的解释颇具深意:限制 token 不只是为了省钱,更是为了减少重复性的「vibe coding」——员工各自用 AI 生成相似的解决方案,而不是复用已有的代码和模板。换句话说,无限制的 AI 使用不仅在烧钱,还在制造大量冗余产出。
「Tokenmaxxing」的兴衰:从一个内部排行榜说起
这些事件汇聚成了一个更大的叙事。今年 5 月,Fortune 以一篇标题文章宣告了「Tokenmaxxing is dead」。
Tokenmaxxing 这个词的起源本身就充满黑色幽默。今年早些时候,Meta 的一名员工自发创建了一个 token 使用量排行榜,让全公司 85,000 名员工比拼谁的 AI token 消耗量最高——Mark Zuckerberg 本人在榜上甚至排不进前 250 名。据报道,Meta 员工在 30 天内消耗了约 60 万亿 token。Amazon 随后也出现了类似的内部排行榜。
这些排行榜很快被公司叫停。Business Insider 援引内部人士的说法称,Amazon 关闭排行榜的原因是「它鼓励员工执行并非真正解决问题的任务,只为提升排名」。Meta 的数据随后泄露到外部,进一步推动了事件的曝光。
Fortune 在 5 月 28 日的文章中指出,tokenmaxxing 的核心谬误在于将 token 消耗量错误地等同于 AI 采用率和生产力。引用一位行业人士的话说:"如果你不能画出一条从 token 消耗到实际交付给用户的功能和特性之间的直接连线,这些 token 成本就越来越难以自圆其说。"
没人知道怎么衡量 AI 的 ROI
Tom's Hardware 在其评论文章中一针见血地概括了这一困境:「泄露的咨询公司音频表明,没有人确切知道如何衡量 AI 的效果。」
这不是技术问题,而是管理问题。企业在 AI 上的支出增长是惊人的——据 BCG 数据,2026 年企业在 AI 上的平均支出已占营收的 1.7%,较 2025 年的 0.8% 翻了一倍多,而 94% 的企业在尚未看到即时回报的情况下仍在持续投入。但与此同时,只有不到 1% 的高管报告了「显著的 AI ROI」。
Tom's Hardware 引用了一个尤其荒诞的案例:一家匿名公司因忘记为员工的 Claude 许可证设置使用上限,在一个月内花费了 5 亿美元。这不是战略投资失败——这是一个管理流程的基本失误。
Accenture 自己正在面对同样的窘境。Kwak 在录音中坦言,Accenture 正在开发 Token IQ 来提供 token 消费的「可见性」。但可见性只是第一步,更深层的问题始终没变:花出去的每一百万 token,到底换回了什么?
从「先用再说」到「精打细算」:AI 供应商的冬天来了?
这股紧缩浪潮的影响正在向产业链上游传导。CNBC 在 6 月 26 日的报道中指出,OpenAI 和 Anthropic 正面临一个新的 AI 现实:企业客户从「tokenmaxxing」全面转向效率优先。
D.A. Davidson 分析师 Gil Luria 对 CNBC 表示:"他们的一些最大企业客户可能开始限制失控的 token 支出。"CNBC 进一步指出,开源模型正在作为更便宜的替代方案崛起,而 Microsoft、Amazon 和 Google 都在推出更侧重于效率的产品方案。
Sam Altman 本人也不得不面对这一现实。在 6 月初的一次企业活动中,他承认:「AI token 成本正在成为一个巨大的问题。」他说,在 2026 年初这个问题从未被提及,「人们对自己花的钱完全满意」;但现在,"这已经成了一种 meme——'我的公司在 Q1 就花光了 2026 全年预算,你能帮我们提高效率吗?'"
与此同时,Microsoft 已经开始取消多个关键产品部门的 Claude Code 许可证,将工程师引导到自家 GitHub Copilot CLI。根据 The Verge 的报道,负责 Windows、Microsoft 365、Outlook、Teams 和 Surface 的 Experiences + Devices 部门被要求在 6 月 30 日前停止使用 Claude Code。
2026 的下半场:砍试点、算 ROI、活下去
Gartner 在 4 月的一份报告中预测,大量未聚焦的 AI 试点项目将在 2026 年被砍掉,预算将从开放式实验转向有明确 ROI 的限定部署。Gartner 将 2026 年定位为 AI 的「幻灭低谷」(Trough of Disillusionment)——AI 将主要通过既有软件厂商销售给企业,「一旦 ROI 变得可预测,规模化才会跟上」。
这一预测正在被验证。从 Accenture 的内部录音到 Uber 的预算超支,从 Walmart 的 token 配给到 Microsoft 的工具切换,2026 年上半年的每一个信号都指向同一个结论:企业 AI 的「先用再说」时代已经结束。
Fortune 的表述最为精炼:tokenmaxxing 作为一种衡量方式本身就是错的——它衡量的是投入,而不是产出。当 CFO 开始看账单的时候,那个用 Claude Opus 把 PDF 转成 PPT 的员工,注定会成为 AI 预算紧缩时代的第一个「优化对象」。
对于 OpenAI 和 Anthropic 来说,这意味着增长叙事的底层逻辑正在改变——从「越用越多」的增长飞轮,转向「用得值不值」的 ROI 考试。而对于企业而言,接下来的课题不再是「要不要用 AI」,而是能不能在下一个季度会上,向 CFO 解释清楚为什么这 $1,500 的 Claude Code 月费是值得的。

