Google 的 Gemini CLI 正式退役：Antigravity 平台接管，Gemini 3.5 Pro 倒计时 9 天

摘要

6 月 18 日，Google 按计划正式关闭了 Gemini CLI，将全部开发者工作流迁移至 Antigravity CLI。这一动作是 Google 重塑 AI 开发者体验的关键一步——Antigravity 平台以桌面应用、CLI、Managed Agents 和 SDK 四层架构，取代了过去分散的工具链。与此同时，Pichai 在 5 月 I/O 上承诺的「给我们一个月」交付 Gemini 3.5 Pro，截至 6 月 21 日仅剩 9 天窗口。Polymarket 预测市场对 6 月 30 日前发布的概率仅为 50–55%——远低于同期 GPT-5.6 的 70%+ 预测概率。Google 的 AI 开发者战略正在经历一场关键的压力测试。

Gemini CLI 正式退役：迁移窗口已关闭

6 月 18 日，Gemini CLI 对 Google AI Pro、Ultra 及 Gemini Code Assist 用户正式下线。Antigravity CLI 成为唯一指定的命令行工具。Google Developers Blog 在此前发布的过渡通知中明确：Gemini CLI 不会被更新，不会并行维护，不会被「延长支持」——它直接退役。

对于依赖 Gemini CLI 的开发团队，这是一个硬性截止日。所有未完成迁移的 CI/CD 脚本、自动化工作流和本地开发工具链，在 6 月 18 日之后直接失效。唯一的例外是付费 Gemini Code Assist 客户，他们获得了额外的宽限期。

迁移本身并不复杂。Antigravity CLI 继承并完整保留了 Gemini CLI 的核心原语——Agent Skills（可复用的能力定义）、Hooks（事件触发动作）、Subagent 定义和 Extensions（在 Antigravity 2.0 术语中改称「插件」）。一条 antigravity migrate --from-gemini-cli 命令即可完成自动转换。但问题不在于迁移的技术难度，而在于 Google 给开发者留出的时间窗口：从 5 月 19 日 I/O 宣布到 6 月 18 日正式关闭，仅 30 天。

Digital Applied 的深度分析指出，Antigravity CLI 是用 Go 从头重写的——取代了此前基于 Node.js 的 Gemini CLI，官方声称「更快、响应更灵敏」。安装方式也标准化为 Homebrew（macOS）和 Winget（Windows），命令行简写为 agy。新增的 cron 式定时任务支持（agy schedule "daily standup summary" --cron "0 9 * * *"）是 Gemini CLI 完全不具备的能力——agent 在桌面应用关闭后仍可继续运行，结果在下次打开 Agent Manager 时呈现。

Antigravity 平台：四层架构重塑开发者体验

Gemini CLI 的退役只是冰山一角。Antigravity 平台的真正野心在于将 Google 分散的 AI 开发者工具统一为一个四层架构。

Google 在 I/O 2026 上同时发布了 Antigravity 2.0 的五个 delivery surface，但本质上可以归纳为四个产品层：

第一层：Antigravity 桌面应用。 这不再是 Antigravity 1.0 的 VS Code fork，而是一个独立的、以 agent 编排为核心的桌面应用。它包含两个操作模式：Editor（代码编辑）和 Agent Manager（agent 编排控制台）。Google 在发布初期曾激进地弱化 Editor 入口，导致开发者社区强烈反弹，最终在 5 月 23 日紧急补丁中恢复了明显的「Open IDE」按钮。Antigravity 工程总监 Varun Mohan 公开承认 Google「应该从一开始就更清楚地说明这一点」——对于 Google 级别的产品发布而言，这是一次罕见的公开致歉。

第二层：Antigravity CLI。 即已取代 Gemini CLI 的 agy 命令行工具。它不仅是终端中的 agent 交互界面，还支持 cron 式定时任务、动态子 agent 编排和后台异步执行。

第三层：Managed Agents API。 这是 Antigravity 平台最具差异化的能力。开发者通过一次 Gemini API 调用即可在 Google 托管的隔离 Linux 沙箱中启动一个有状态的自主 agent。该 agent 拥有代码执行权限和网页浏览能力，其状态在多次对话轮次中持续保留。Managed Agents 本质上是将「agent 即服务」作为基础设施提供——开发者定义 agent 行为，Google Cloud 负责运行、扩展和治理。

第四层：SDK。 提供 Python、TypeScript 和 Go 三种语言的 SDK，暴露 Tool.shell、Tool.code_edit、Tool.web_search 等原语，并内置了 Gemini 优化的上下文缓存。开发者可以自定义系统提示词和工具目录，构建完全可控的 agent 部署。

这四层架构共享同一个底层 agent harness——与 Gemini 模型协同优化的推理引擎，支持动态子 agent 生成、异步任务管理和 hooks 系统。Google 的赌注很明确：agent 编排应该有一个独立于 IDE 的第一公民级产品形态。

Gemini 3.5 Pro 倒计时：9 天，市场信心不足

5 月 19 日 Google I/O 舞台上，当 Sundar Pichai 说出「Give us until next month to get it to you」时，现场开发者发出了清晰可闻的叹息。Gemini 3.5 Flash 已经在当天全面上线，但旗舰级的 Gemini 3.5 Pro 被留在了「下个月」的承诺中。

现在，这个承诺的兑现窗口仅剩 9 天。

Polymarket 交易员对「Gemini 3.5 Pro 在 6 月 30 日前发布」给出的概率仅为 50–55%。FindSkill.ai 的实时追踪页面指出，这一数字明显低于同期预测市场对 GPT-5.6 的定价——GPT-5.6 在 6 月 22–28 日窗口的隐含概率约为 70.5%，在 7 月 31 日前发布的概率更高。换句话说，市场对 Google 按时兑现承诺的信心，显著低于对 OpenAI 迭代节奏的信心。

Gemini 3.5 Pro 目前仍处于 Vertex AI 的有限预览阶段，仅对少数企业客户开放。Google 内部正在使用该模型，但公开 GA 的日期仍然没有官方确认。CoderSera 的发布指南指出，Google 历史上会通过单一 blog.google 博文发布 Pro 模型，附带完整基准测试表格——不会分阶段推送，也不会在社交媒体上预热。开发者应关注 Google AI 博客和 Gemini API 变更日志，而非等待排期公告。

竞争态势：每一天的延迟都在重新分配市场

Gemini 3.5 Pro 每延迟一天，竞争格局就多维持一天现状。

当前前沿模型的格局是：Claude Opus 4.8 是 Anthropic 在 Fable 5 被美国出口管制禁令下架后最强的可用模型；GPT-5.5 在数学推理和消费者覆盖面上保持领先；Gemini 3.5 Flash 在终端 agent 基准测试（Terminal-Bench 2.1 得分 76.2%）和多模态理解（CharXiv Reasoning 84.2%）上已经建立了竞争优势——但 Flash 毕竟是 Flash，它在长上下文检索、硬推理和仓库级编码上仍有明显短板。

Gemini 3.5 Pro 被寄望于填补这些短板。预期在 MRCR v2 长上下文检索（128K 段）上从 Flash 的 77.3% 提升至 86–90%，在 SWE-Bench Pro 上从 55.1% 追近 Opus 4.8 的 64.3%，在 ARC-AGI-2 上通过 Deep Think HIGH 模式冲击 80–85%。如果 Pro 能在 6 月 30 日前交付并兑现这些数据，它将是 Google 有史以来最具竞争力的 Gemini 模型。

但如果错过 6 月 30 日这个窗口——也就是说，Pichai 在 I/O 舞台上的公开承诺未能兑现——Google 将面临双重的信誉损失：对开发者（承诺了交付时间却未兑现）和对市场（在 Flash 已经建立势头的窗口期未能推出旗舰产品）。

预期规格与定价

综合 CoderSera、AI Weekly 和 Ofoxa.ai 的多方报道，Gemini 3.5 Pro 的预期规格如下：

上下文窗口： 200 万 token 输入——是 Flash 的 1M 的两倍，也是目前所有量产前沿模型中最大的。相比之下，Claude Opus 4.8 标准为 200K（1M 为 beta），GPT-5.5 为 256K（扩展模式 922K+128K）。
Deep Think 推理模式： 预计继承并改进 Gemini 3.1 Pro 的三级思考系统（LOW/MEDIUM/HIGH），HIGH 模式激活 Deep Think。该模式预计将预留给 Google AI Ultra（$250/月）订阅用户，而非 $20/月的 Pro 用户。
前沿多模态： 文本、图像、音频、视频的统一处理，在 Gemini 3.5 Flash 已有的多模态领先基础上进一步提升。
定价： 预计 $15/百万输入 token，$60/百万输出 token——约为 Flash（$1.50/$9）的 6–10 倍，但仍比 GPT-5.5（$5/$30）和 Claude Opus 4.8（$5/$25）在单位推理成本上保持竞争力。上下文缓存可降低 90% 成本，批量模式提供半价优惠。

两个需要注意的操作细节：200K token 以上的请求会触发整个请求的 2x/1.5x 重新定价（不是超量部分），以及免费层请求可能被用于模型训练——涉及专有代码或客户数据的工作负载应切换到付费项目。

Google 的 AI 开发者体验正在经历一场深度重构。Gemini CLI 的退役和 Antigravity 平台的全面接管是这场重构的可见部分——它改变了开发者与 Google AI agent 交互的每一个接触面。而 Gemini 3.5 Pro 的倒计时则是这场重构的不可见压力：9 天，一个公开承诺，一个 50–55% 的市场信心。无论 Pro 是否按时交付，Antigravity 平台已经确立了 Google 在 agent 时代的开发者基础设施布局。但 Pro 能否在窗口期内落地，将决定这个布局是「有旗舰坐镇的完整生态」还是「只有轻量级选手撑场的半成品」。