FIRST 预测 2026 年 CVE 漏洞将达 66,000 个：AI 自动发现已远超人类修补能力

摘要

2026 年 6 月 15 日，事件响应与安全团队论坛（FIRST）在第 38 届年会上发布了年中漏洞预测更新：2026 年全年 CVE 披露数量预计将达到约 66,000 个，较 2 月预测中位数 59,427 大幅上调，且前四个月实际数据已超出原预测 46.3%。AI 驱动的自主漏洞发现工具——尤其是 Anthropic 的 Claude Mythos Preview 和 OpenAI 的 GPT-5.4-Cyber——正在以前所未有的速度挖掘软件漏洞，而人类安全团队的修补能力远远跟不上这一节奏。本文梳理数据背后的结构性矛盾，并探讨其对行业运作模式的深远影响。

66,000 个 CVE：一个被 AI 重塑的漏洞生态

过去的十年里，全球 CVE 年披露量大致稳定在 25,000 至 30,000 区间。即便在 2020 至 2025 年间 NIST 报告 CVE 提交量增长了 263%，年总量也从未逼近 70,000 这条线。但 2026 年正在打破所有既有预期。

根据 FIRST 在丹佛发布的年中预测，2026 年 CVE 实际披露量已远超年初模型。FIRST 漏洞预测团队使用 ExponentialSmoothing 模型对 2020 年 1 月至 2026 年 4 月的每日 CVE 发布数据进行训练，发现截至 4 月已有 6,420 个超额 CVE 被记录，全年预测值从 2 月的 59,427 上调至约 66,000。这是历史上首次年漏洞披露量逼近 70,000 大关。

FIRST 将这一激增归因于三个结构性驱动因素：AI 辅助漏洞发现、GitHub Security Advisory（GHSA）年同比增长 449%、以及 VulnCheck 的 CNA-of-Last-Resort 活动暴增 3,119%（吸收了此前大量未分配漏洞的积压）。其中，AI 辅助发现是最具颠覆性的变量。

FIRST 联络官兼漏洞预测团队负责人 Éireann Leverett 对此评论道："我们正在见证漏洞格局的重大转变，不是因为软件突然变得更不安全，而是因为我们集体发现漏洞的能力已经被结构性改造。防御者面临的挑战不再是漏洞的发现，而是以行业前所未有的规模去验证、协调和优先级排序这些漏洞。"

值得注意的是，FIRST 提出了一个"雨与洪水"的区分：原始 CVE 总量确实在飙升，但经过 CISA KEV 目录或 EPSS 评分（高于 10%）过滤后，真正需要紧急修补的漏洞数量并未同比例增长。这意味着安全团队如果使用基于可利用性的分层工具，仍可在不按比例扩充人员的情况下管理风险敞口。但这一窗口期可能不会持续太久——随着对抗性 AI 的成熟，AI 加速漏洞利用与 AI 加速补丁生成之间的竞赛，将成为 2026 年下半年最核心的安全动态。

Project Glasswing：一个模型单月发现量匹敌人类一年

如果说 FIRST 的预测描绘了宏观趋势，那么 Anthropic 的 Project Glasswing 则是这一趋势最生动的微观注脚。

2026 年 4 月 7 日，Anthropic 联合 AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux 基金会、Microsoft、NVIDIA 和 Palo Alto Networks 等合作伙伴，共同发起了 Project Glasswing 计划，目标是在 AI 驱动的网络攻击时代到来之前，为防御者建立持久的优势。

该计划的核心是 Claude Mythos Preview——一个未公开的、具备通用能力的前沿模型，其代码理解和推理能力在多个基准测试中远超 Anthropic 此前最强的 Opus 4.6。在 CyberGym 网络安全漏洞复现任务中，Mythos Preview 达到 83.1%，而 Opus 4.6 为 66.6%；在 SWE-bench Verified 上，Mythos Preview 达到 77.8%，Opus 4.6 则为 53.4%。

但真正令行业震动的是它在真实代码库中的表现。根据 Anthropic 的官方更新和 CyberScoop 的报道，Claude Mythos Preview 在单月部署中扫描了超过 1,000 个开源项目，标记出 23,019 个潜在漏洞，其中 6,202 个被评估为高危或严重级别。在 1,752 个经过独立审查的高危/严重发现中，超过 90% 被确认为真实有效——一个在漏洞研究领域前所未闻的确认率。

这一数字意味着什么？在 AI 前时代，全球所有人类漏洞研究者一年的发现量大约也在这个量级。而现在，一个 AI 模型在一个月内就能做到。

Mythos Preview 的发现不仅数量惊人，深度也令人警醒。它发现了 OpenBSD 中一个潜伏了 27 年的漏洞——OpenBSD 一直以安全性著称，被广泛用于防火墙等关键基础设施。它还在 FFmpeg 中发现了一个 16 年前的漏洞，而该漏洞所在的代码行已被自动化测试工具命中超过 500 万次却从未被标记。在 Linux 内核中，它自主发现并串联了多个漏洞，能够将普通用户权限提升至对机器的完全控制。

Anthropic 自身也承认："修补此类漏洞的瓶颈在于人类进行分类、报告、设计和部署补丁的能力。"

结构性矛盾：发现是指数级的，修补是线性的

这里存在一个根本性的不对称。AI 漏洞发现工具的性能受算力、模型能力和部署规模驱动，理论上可以呈指数级增长。但人类安全团队的修补能力受限于人头数、工时和认知带宽——这些都不会翻倍。

Cloudflare 在使用 Mythos Preview 扫描其关键路径系统后，发现了 2,000 个漏洞，其中 400 个为高危或严重级别，误报率优于人类测试者。Mozilla 在 Firefox 150 版本中利用 Mythos Preview 发现并修复了 271 个漏洞，是此前版本使用 Anthropic 早期模型时发现量的十倍以上。多家合作伙伴报告称，部署 Mythos Preview 后漏洞发现率提升了超过十倍。

与此同时，FIRST 的数据显示，有漏洞的独立软件产品数量已经增长了两个数量级——这组增长独立于 AI 或 CNA 结构变化，纯粹反映了软件资产多样性本身的膨胀。再加上 AI 助手生成的"一次性代码"——这些代码可能包含漏洞却永远不会进入 CVE 注册表——传统扫描和补丁程序在结构上对这部分风险是盲目的。

Cloud Security Alliance、SANS Institute 和 OWASP 联合发布的一份报告得出了一个直白的结论：组织在短期内"很可能被压倒"——威胁行为者利用 AI 发现和利用漏洞的速度将超过防御者打补丁的速度。

Fable 5 禁令：在最需要防御工具时剥夺它们

正是在这一背景下，美国政府于 6 月 12 日对 Anthropic 的 Fable 5 和 Mythos 5 模型下达了出口管制指令，理由是未指明的国家安全关切。Anthropic 随后在全球范围内暂停了这两个模型的访问。

Fable 5 是 Anthropic 于 6 月 9 日发布的 Mythos 公开版本，内置了严格的护栏——在生物、化学和网络安全领域基本阻断了所有相关提示。许多安全研究者发现，Fable 5 的护栏严格到几乎拒绝任何与网络安全相关的提示。

这一禁令的导火索据报道是一份由 Amazon 研究人员撰写的未公开论文，声称展示了绕过 Fable 5 护栏的方法。但漏洞披露与赏金平台先驱 Katie Moussouris 在审阅该论文后指出，论文中描述的方法并非真正的越狱，而只是要求 Fable 修复包含已知公开漏洞和故意植入漏洞的开源代码——这正是防御性安全工作中最基本、最有价值的"发现-修复-测试"循环。

6 月 15 日，76 名网络安全专家——包括前 Facebook 安全主管 Alex Stamos、Bugcrowd 创始人 Casey Ellis、著名密码学家 Jon Callas、以及 Moussouris 本人——在 freefable.org 发表公开信，呼吁白宫解除对 Fable 和 Mythos 的出口管制。公开信写道："在没有充分理由的情况下，将最好的能力从防御者手中夺走，而我们的对手正在快速进步，这是危险的。"

这一禁令的时间点尤其值得玩味。在 FIRST 预测 2026 年 CVE 将达 66,000 个的同一天，在 Anthropic 宣布 Project Glasswing 将扩展至 15 个国家约 150 个组织的两周之后，美国政府收紧了防御者获取最强大 AI 工具的渠道。无论禁令背后的国家安全理由是否成立，其实际效果是在漏洞积压呈指数增长之际，系统性地削弱了防御方的工具能力。

行业拐点：从"人修补"到"AI 辅助自动化修补"

综合上述数据，一个结论正在浮现：安全行业的运作模式必须发生根本性转变。

过去三十年，漏洞管理的核心范式是"人类发现-人类验证-人类修补"。即便有了自动化扫描工具，最终的决策权仍在人类分析师手中。但在 AI 每月可发现两万多个漏洞、年 CVE 总量冲向 66,000 的时代，这一范式已经不可持续。

FIRST 在其年中预测中明确建议组织"立即采用可利用性分层工具"（EPSS 和 CISA KEV），并"现在就开始投入防御性 AI 工具"。Anthropic 也在 4 月底推出了 Claude Security 公开测试版，使用 Claude Opus 4.8 扫描代码库并生成补丁，三周内修补了超过 2,100 个漏洞。

但仅靠少数几家 AI 公司的内部工具远远不够。整个行业需要在以下方向上加速：

自动化补丁生成与验证：AI 不仅应发现漏洞，还应能够生成、测试和部署补丁，压缩平均修复时间（MTTR）。
动态漏洞编目：AI 生成的一次性代码带来的漏洞需要运行时监控和 AI 物料清单（AI-BOM）来追踪，而非依赖静态 CVE 注册表。
安全不变式设计：从"逐个修补漏洞"转向消除整类攻击向量的安全架构设计——例如出口控制、正向执行控制和硬件支持的抗钓鱼认证。
跨组织协调：正如 FIRST CEO Chris Gibson 所言，"没有一个组织可以独自解决所有问题。能够在 2026 年的漏洞风暴中生存下来的团队，是那些已经建立了可信网络、在危机发生前就共享情报和协调响应的团队。"

漏洞债务正在以指数级速度累积。如果安全行业的应对方式仍然是"加人、加班、加预算"的线性模式，那么无论投入多少资源，差距只会越来越大。唯一的出路是让 AI 同时承担发现和修补的双重角色——而这意味着，政策制定者必须确保防御者能够获得最强大的 AI 工具，而不是在漏洞洪峰到来之际将它们锁在门外。