OpenAI「补丁星球」计划：当 AI 安全战场从「制造威胁」转向「修补漏洞」

2026 年 6 月 22 日，距离柏林 Pwn2Own 黑客大赛仅剩两天，Mozilla 紧急推送了一个 Firefox 补丁。这个补丁修复的漏洞编号 CVE-2026-8390，位于 WebAssembly 引擎中——而发现它的并非任何一支注册参赛的战队，而是 OpenAI 的 GPT-5.5 模型在安全评估中自动扫描出来的。消息传出后，六支注册了 Firefox 目标的参赛队伍中，有五支选择退出。

这个戏剧性的插曲，是 OpenAI 当天宣布的「Patch the Planet」（补丁星球）计划中最具冲击力的注脚。该计划隶属于 OpenAI 今年 5 月推出的 Daybreak 网络安全项目，由 OpenAI 与著名安全研究公司 Trail of Bits 联合发起，并引入漏洞管理平台 HackerOne 和 Calif 作为协作方。它的核心逻辑直白得近乎天真：把最前沿的 AI 模型从「攻击者」变成「修补者」，用机器速度替开源项目堵上漏洞，而不是制造漏洞。

从「AI 太危险」到「AI 是安全基础设施」

Patch the Planet 的发布时机绝非巧合。就在十天前——6 月 12 日，Anthropic 在发布 Claude Fable 5 和 Mythos 5 仅三天后，就被美国商务部以国家安全为由下达出口管制指令，要求 Anthropic 禁止任何外国公民访问这两款模型。由于 Anthropic 无法按国籍精准筛选用户，最终只能将两款模型全球下线。据《华尔街日报》报道，触发这一决定的导火索是亚马逊 CEO Andy Jassy 向财政部长 Scott Bessent 等政府官员表示，亚马逊研究人员使用 Claude Fable 5 获取了可用于网络攻击的信息。

Anthropic 的遭遇为整个行业划下了一道刺眼的红线：当 AI 模型强大到足以自动发现和利用漏洞时，它究竟是武器还是盾牌？美国政府的选择是按下暂停键，而 OpenAI 给出的答案截然不同——不是限制模型能力，而是将能力导向防御。

OpenAI 网络安全技术负责人 Fouad Matin 的表述精准地捕捉了这一转向：「开源维护者出于对开源的热爱而工作，而现在他们被困在审查『AI 垃圾 CVE 报告』的泥潭里。」Patch the Planet 的目标是「尽可能高效地降低维护者的负担——代码库评估、验证潜在报告、创建补丁并落地。我们想抵消成本，无论是 token 还是人力，去尽可能多地修补世界上的软件。」

不是甩一堆报告，而是带着补丁上门

Patch the Planet 与目前泛滥的 AI 漏洞扫描工具有一个本质区别：它不向维护者倾倒未经筛选的 AI 生成报告。Trail of Bits 投入了其整个安全研究组织——在启动冲刺周中，约 25 名工程师（约占公司五分之一人力）同时投入，覆盖了 19 个开源项目。每一份 AI 发现都要经过安全工程师的人工审核，确认有效性、评估严重性、开发补丁，然后才送达维护者手中。

Trail of Bits CEO 兼联合创始人 Dan Guido 说：「Patch the Planet 是一项互联网规模的努力，旨在帮助开源软件领先于 AI 漏洞狩猎工具。但它也是一项努力，帮助开源社区看到 AI 编码工具的好处，而不仅仅是坏处。」

首周成果令人瞩目：数百个已发现漏洞、64 个 Pull Request、51 个 Issue（其中 19 个已关闭并修复），37 个补丁已合并。但这只是公开统计——更多发现通过 HackerOne、GitHub 安全公告、邮件列表和私有分支等渠道进行协调披露，尚未公开。

参与首轮的项目名单横跨了整个互联网基础设施：cURL、NATS Server、pyca/cryptography、Sigstore、aiohttp、Go 项目、freenginx、Python 和 python.org、urllib3、PyPI、SimpleX、Valkey、RustCrypto 等。目前已有超过 30 个项目加入，等候名单仍在增长。

值得注意的是，cURL 的参与尤其具有象征意义。其创始人兼首席开发者 Daniel Stenberg 是 AI 驱动漏洞报告泛滥最激烈的批评者之一——他曾撰文抨击这种现象为「被一千个 AI 垃圾报告慢慢淹死」。Patch the Planet 的「先审核、再提交」模式，恰恰回应了 Stenberg 这类维护者的核心诉求。

GPT-5.5-Cyber：防御专用的「网安特化模型」

Patch the Planet 的技术引擎是 GPT-5.5-Cyber——OpenAI 最强大的网络安全专用模型，在 CyberGym 基准测试中取得了 85.6% 的成绩，不仅超越了标准 GPT-5.5 的 81.8%，也压过了 Anthropic Mythos 5 的 83.8%。但 OpenAI 严格限制了该模型的访问权限：仅通过「Trusted Access for Cyber」计划向经过审查的防御方开放，不公开发布。

同时发布的 Codex Security 插件则面向更广泛的用户，可自动扫描代码、验证漏洞、生成补丁。自 3 月研究预览版上线以来，Codex Security 已扫描超过 3000 万次提交、覆盖超过 3 万个代码库，人工审核标记为「已修复」的发现超过 7 万项。Matin 透露，OpenAI 已为开源和私有代码的 Codex Security 使用补贴了「大约 20 万亿 token」。

Trail of Bits 的博客详细记录了几个令人印象深刻的案例：

一天搭建的 Fuzzing 实验室。 GPT-5.5-Cyber 接到「发现可远程利用的漏洞」这一目标后，自主决定通读一个被高度审查的 C 库源码是低效的 token 使用方式。它用不到一天时间搭建了完整的 fuzzing 实验室：消毒器和变体构建、基于现有测试的种子语料库、覆盖十几个入口点的 harness。更关键的是，它没有简单地对暴露 API 进行 fuzz，而是构建了一个注入操作系统背压的 harness，成功触达了此前未被探索的异常状态。Trail of Bits 估计，这些工作由一名 fuzzing 专家手动完成可能需要两到三周。

历史 CVE 变体分析流水线。 Codex 的 /goal 功能配合 GPT-5.5-Cyber 构建了针对历史 CVE 的变体分析流水线，产出几乎全部为高信号发现。在 dnsmasq 上，Codex 提前标记了与后来被分配 CVE 编号并修复的 6 个漏洞中 4 个相匹配的模式。

跨项目差分测试。 研究人员让 Codex 对实现了相同加密算法和标准（如 X.509 证书）的多个项目进行互相对照测试，发现了包括 PyCA 中 AES-GCM 问题和多个 X.509 问题在内的漏洞。

发现漏洞已不是难题——修复才是

Trail of Bits 在博客中写下了一句意味深长的判断：「发现漏洞现在是容易的部分。」安全工作的瓶颈已经从「找到漏洞」转移到「之后的一切」：确认发现的有效性、正确评估严重性、写出一份维护者愿意接受的补丁、加固周边代码、做出长期改进以防止类似问题再次出现，以及协调披露流程。

这正是 AI 生成报告泛滥对开源生态造成的真正威胁。OpenAI 援引 Linux 基金会与哈佛大学的研究指出，在广泛使用的开源项目中，94% 的项目由不到 10 名开发者负责超过 90% 的代码。当这些本就超负荷运转的维护者面对 AI 工具制造的漏洞报告洪流时，结果不是更安全，而是更大的积压。

Trail of Bits 开发了一个名为 Patchy 的机器人来追踪所有工作进度。Patchy 监控每个项目，将每一项新发现和已合并补丁推送到 Slack，并在补丁落地时庆祝性地喊出「PATCHY HAPPY」。但 Patchy 也揭示了一个核心问题：如果不提供项目特定的威胁模型和严重性标准，模型倾向于将所有发现都标记为「严重」。PyCA 的安全文档在减少误报方面「效果显著」，而像 AGENTS.md 这样明确告诉模型查阅哪些文档的文件则产生了「最一致和有效的结果」。

防御叙事与行业竞争

五眼情报联盟在 OpenAI 发布同日发表了一份罕见的联合声明，警告「前沿 AI 模型预计将超越当前行业预期，从根本上改变进攻性和防御性网络能力。时间线不是年，而是月……在这种环境下，网络韧性至关重要。」

这份声明无意中为 OpenAI 的策略提供了最佳背书。当 Anthropic 在与美国政府的对峙中被迫下线旗舰模型时，OpenAI 却在过去一个月内与澳大利亚、加拿大、法国、德国、日本、韩国及欧盟机构签署了 Trusted Access 合作协议，并宣布了 Daybreak 网络合作伙伴计划，启动伙伴包括 Accenture、Cisco、CrowdStrike、IBM、Okta、Palo Alto Networks 和 Wiz。

两家公司都在筹备 IPO，竞争的维度已远超产品层面。Anthropic 选择了一条更激进的道路——公开发布具有高级网络安全能力的模型，结果撞上了监管的墙。OpenAI 则选择了一条更审慎的路径：将最强能力锁在 Trusted Access 的围墙内，将叙事重心从「模型能力」转向「防御价值」。

Patch the Planet 的参与项目将获得六个月的 ChatGPT Pro 和六个月的 Codex Security 免费使用权，以及可长期沿用的基础设施和工作流改进。Guido 说：「到目前为止，Patch the Planet 只有大约一半时间花在发现漏洞上。我们试图找到最表层、最容易发现、最严重的漏洞并将它们清除，但另一半时间我们花在定制化 agent 上，让它们能持续在代码库上工作，这样我们可以把它们留给维护者，并教会他们如何使用。」

在一个 AI 安全叙事被「限制能力」和「出口管制」主导的时刻，OpenAI 用 Patch the Planet 开辟了另一条路径：不是阻止 AI 变得更强，而是让最强的 AI 站在防御者一边。对于长期被忽视的开源维护者而言，无论这种转向背后有多少商业考量，一批带着补丁上门的工程师总比另一堆 AI 生成的漏洞报告要好得多。