摘要
6 月 18 日,Google 按计划正式关闭了 Gemini CLI,将全部开发者工作流迁移至 Antigravity CLI。这一动作是 Google 重塑 AI 开发者体验的关键一步——Antigravity 平台以桌面应用、CLI、Managed Agents 和 SDK 四层架构,取代了过去分散的工具链。与此同时,Pichai 在 5 月 I/O 上承诺的「给我们一个月」交付 Gemini 3.5 Pro,截至 6 月 21 日仅剩 9 天窗口。Polymarket 预测市场对 6 月 30 日前发布的概率仅为 50–55%——远低于同期 GPT-5.6 的 70%+ 预测概率。Google 的 AI 开发者战略正在经历一场关键的压力测试。
Gemini CLI 正式退役:迁移窗口已关闭
6 月 18 日,Gemini CLI 对 Google AI Pro、Ultra 及 Gemini Code Assist 用户正式下线。Antigravity CLI 成为唯一指定的命令行工具。Google Developers Blog 在此前发布的过渡通知中明确:Gemini CLI 不会被更新,不会并行维护,不会被「延长支持」——它直接退役。
对于依赖 Gemini CLI 的开发团队,这是一个硬性截止日。所有未完成迁移的 CI/CD 脚本、自动化工作流和本地开发工具链,在 6 月 18 日之后直接失效。唯一的例外是付费 Gemini Code Assist 客户,他们获得了额外的宽限期。
迁移本身并不复杂。Antigravity CLI 继承并完整保留了 Gemini CLI 的核心原语——Agent Skills(可复用的能力定义)、Hooks(事件触发动作)、Subagent 定义和 Extensions(在 Antigravity 2.0 术语中改称「插件」)。一条 antigravity migrate --from-gemini-cli 命令即可完成自动转换。但问题不在于迁移的技术难度,而在于 Google 给开发者留出的时间窗口:从 5 月 19 日 I/O 宣布到 6 月 18 日正式关闭,仅 30 天。
Digital Applied 的深度分析指出,Antigravity CLI 是用 Go 从头重写的——取代了此前基于 Node.js 的 Gemini CLI,官方声称「更快、响应更灵敏」。安装方式也标准化为 Homebrew(macOS)和 Winget(Windows),命令行简写为 agy。新增的 cron 式定时任务支持(agy schedule "daily standup summary" --cron "0 9 * * *")是 Gemini CLI 完全不具备的能力——agent 在桌面应用关闭后仍可继续运行,结果在下次打开 Agent Manager 时呈现。
Antigravity 平台:四层架构重塑开发者体验
Gemini CLI 的退役只是冰山一角。Antigravity 平台的真正野心在于将 Google 分散的 AI 开发者工具统一为一个四层架构。
Google 在 I/O 2026 上同时发布了 Antigravity 2.0 的五个 delivery surface,但本质上可以归纳为四个产品层:
第一层:Antigravity 桌面应用。 这不再是 Antigravity 1.0 的 VS Code fork,而是一个独立的、以 agent 编排为核心的桌面应用。它包含两个操作模式:Editor(代码编辑)和 Agent Manager(agent 编排控制台)。Google 在发布初期曾激进地弱化 Editor 入口,导致开发者社区强烈反弹,最终在 5 月 23 日紧急补丁中恢复了明显的「Open IDE」按钮。Antigravity 工程总监 Varun Mohan 公开承认 Google「应该从一开始就更清楚地说明这一点」——对于 Google 级别的产品发布而言,这是一次罕见的公开致歉。
第二层:Antigravity CLI。 即已取代 Gemini CLI 的 agy 命令行工具。它不仅是终端中的 agent 交互界面,还支持 cron 式定时任务、动态子 agent 编排和后台异步执行。
第三层:Managed Agents API。 这是 Antigravity 平台最具差异化的能力。开发者通过一次 Gemini API 调用即可在 Google 托管的隔离 Linux 沙箱中启动一个有状态的自主 agent。该 agent 拥有代码执行权限和网页浏览能力,其状态在多次对话轮次中持续保留。Managed Agents 本质上是将「agent 即服务」作为基础设施提供——开发者定义 agent 行为,Google Cloud 负责运行、扩展和治理。
第四层:SDK。 提供 Python、TypeScript 和 Go 三种语言的 SDK,暴露 Tool.shell、Tool.code_edit、Tool.web_search 等原语,并内置了 Gemini 优化的上下文缓存。开发者可以自定义系统提示词和工具目录,构建完全可控的 agent 部署。
这四层架构共享同一个底层 agent harness——与 Gemini 模型协同优化的推理引擎,支持动态子 agent 生成、异步任务管理和 hooks 系统。Google 的赌注很明确:agent 编排应该有一个独立于 IDE 的第一公民级产品形态。
Gemini 3.5 Pro 倒计时:9 天,市场信心不足
5 月 19 日 Google I/O 舞台上,当 Sundar Pichai 说出「Give us until next month to get it to you」时,现场开发者发出了清晰可闻的叹息。Gemini 3.5 Flash 已经在当天全面上线,但旗舰级的 Gemini 3.5 Pro 被留在了「下个月」的承诺中。
现在,这个承诺的兑现窗口仅剩 9 天。
Polymarket 交易员对「Gemini 3.5 Pro 在 6 月 30 日前发布」给出的概率仅为 50–55%。FindSkill.ai 的实时追踪页面指出,这一数字明显低于同期预测市场对 GPT-5.6 的定价——GPT-5.6 在 6 月 22–28 日窗口的隐含概率约为 70.5%,在 7 月 31 日前发布的概率更高。换句话说,市场对 Google 按时兑现承诺的信心,显著低于对 OpenAI 迭代节奏的信心。
Gemini 3.5 Pro 目前仍处于 Vertex AI 的有限预览阶段,仅对少数企业客户开放。Google 内部正在使用该模型,但公开 GA 的日期仍然没有官方确认。CoderSera 的发布指南指出,Google 历史上会通过单一 blog.google 博文发布 Pro 模型,附带完整基准测试表格——不会分阶段推送,也不会在社交媒体上预热。开发者应关注 Google AI 博客和 Gemini API 变更日志,而非等待排期公告。
竞争态势:每一天的延迟都在重新分配市场
Gemini 3.5 Pro 每延迟一天,竞争格局就多维持一天现状。
当前前沿模型的格局是:Claude Opus 4.8 是 Anthropic 在 Fable 5 被美国出口管制禁令下架后最强的可用模型;GPT-5.5 在数学推理和消费者覆盖面上保持领先;Gemini 3.5 Flash 在终端 agent 基准测试(Terminal-Bench 2.1 得分 76.2%)和多模态理解(CharXiv Reasoning 84.2%)上已经建立了竞争优势——但 Flash 毕竟是 Flash,它在长上下文检索、硬推理和仓库级编码上仍有明显短板。
Gemini 3.5 Pro 被寄望于填补这些短板。预期在 MRCR v2 长上下文检索(128K 段)上从 Flash 的 77.3% 提升至 86–90%,在 SWE-Bench Pro 上从 55.1% 追近 Opus 4.8 的 64.3%,在 ARC-AGI-2 上通过 Deep Think HIGH 模式冲击 80–85%。如果 Pro 能在 6 月 30 日前交付并兑现这些数据,它将是 Google 有史以来最具竞争力的 Gemini 模型。
但如果错过 6 月 30 日这个窗口——也就是说,Pichai 在 I/O 舞台上的公开承诺未能兑现——Google 将面临双重的信誉损失:对开发者(承诺了交付时间却未兑现)和对市场(在 Flash 已经建立势头的窗口期未能推出旗舰产品)。
预期规格与定价
综合 CoderSera、AI Weekly 和 Ofoxa.ai 的多方报道,Gemini 3.5 Pro 的预期规格如下:
- 上下文窗口: 200 万 token 输入——是 Flash 的 1M 的两倍,也是目前所有量产前沿模型中最大的。相比之下,Claude Opus 4.8 标准为 200K(1M 为 beta),GPT-5.5 为 256K(扩展模式 922K+128K)。
- Deep Think 推理模式: 预计继承并改进 Gemini 3.1 Pro 的三级思考系统(LOW/MEDIUM/HIGH),HIGH 模式激活 Deep Think。该模式预计将预留给 Google AI Ultra($250/月)订阅用户,而非 $20/月的 Pro 用户。
- 前沿多模态: 文本、图像、音频、视频的统一处理,在 Gemini 3.5 Flash 已有的多模态领先基础上进一步提升。
- 定价: 预计 $15/百万输入 token,$60/百万输出 token——约为 Flash($1.50/$9)的 6–10 倍,但仍比 GPT-5.5($5/$30)和 Claude Opus 4.8($5/$25)在单位推理成本上保持竞争力。上下文缓存可降低 90% 成本,批量模式提供半价优惠。
两个需要注意的操作细节:200K token 以上的请求会触发整个请求的 2x/1.5x 重新定价(不是超量部分),以及免费层请求可能被用于模型训练——涉及专有代码或客户数据的工作负载应切换到付费项目。
Google 的 AI 开发者体验正在经历一场深度重构。Gemini CLI 的退役和 Antigravity 平台的全面接管是这场重构的可见部分——它改变了开发者与 Google AI agent 交互的每一个接触面。而 Gemini 3.5 Pro 的倒计时则是这场重构的不可见压力:9 天,一个公开承诺,一个 50–55% 的市场信心。无论 Pro 是否按时交付,Antigravity 平台已经确立了 Google 在 agent 时代的开发者基础设施布局。但 Pro 能否在窗口期内落地,将决定这个布局是「有旗舰坐镇的完整生态」还是「只有轻量级选手撑场的半成品」。

