2026 年 6 月 21 日,一个名为 Apertus 的开源基础模型在 Hacker News 上引发广泛讨论。这个由瑞士联邦理工学院(EPFL、ETH Zurich)与瑞士国家超算中心(CSCS)联合打造的模型,以「主权 AI」(Sovereign AI)为旗帜,不仅将训练数据、代码、权重、方法全部公开,更在模型层面内建了欧盟 AI 法案(EU AI Act)的合规机制——这在全球范围内尚属首次。
不只是「开放权重」:Apertus 的全开源意味着什么
开源 AI 领域长期存在「开放权重」(open-weight)与「真正开源」的争论。大多数所谓的「开源模型」——包括 Meta 的 Llama 系列、Mistral、DeepSeek 等——仅公开模型权重,而训练数据构成、数据清洗流程、训练代码与超参数配置等关键信息则语焉不详。这种「开放权重」模式在学术界被称为「开放洗白」(open-washing),因为它让外部研究者无法真正复现、审计或理解模型的行为根源。
Apertus 则走了一条完全不同的路。根据其官网描述以及一篇近期发表于 arXiv 的医学 LLM 研究论文(Fully Open Meditron),Apertus 被归类为 「全开放」(Fully Open, FO)模型——即暴露从数据溯源、训练流程到推理管线的完整技术栈。该论文将 Apertus-70B 和 Apertus-8B-Instruct 与 OLMo-2-32B-SFT、EuroLLM-22B/9B-Instruct 并列为当前可用的 FO 基础模型,并在医学领域微调后,Apertus-70B-MeditronFO 取得了 53.8% 的综合医学基准得分(较基座提升 6.6 个百分点),创下全开放模型的新纪录。
与 AI2 的 OLMo 系列相比,Apertus 在透明度理念上一脉相承——两者都公开训练数据(Dolma 之于 OLMo,Apertus 则使用自建合规语料库)、训练代码、中间检查点和完整权重。但 Apertus 的关键差异化在于合规性内置:它不是在模型发布后再叠加外部过滤器,而是在预训练与对齐阶段就将合规作为一项工程目标嵌入。
「主权 AI」的政治经济学:欧洲为何需要自己的基础模型
「主权 AI」并非一个技术术语,而是一个地缘政治经济学概念。它的核心主张是:在 AI 基础设施日益成为国家竞争力的关键要素的时代,依赖美国或中国的基础模型意味着将数据主权、价值观对齐和经济附加值拱手让人。
欧洲在这一领域的焦虑由来已久。尽管拥有世界级的 AI 研究机构(DeepMind 起源于伦敦、Mistral 诞生于巴黎),但欧洲长期缺乏一个由本土机构主导、完全透明、可审计的大规模基础模型。GPT-NL(荷兰主权语言模型)和 EuroLLM 等项目代表了零散的国别努力,而 Apertus 则试图成为瑞士——乃至整个欧洲——的旗舰答案。
Apertus 的发布时机也颇具深意。欧盟 AI 法案于 2024 年通过,2025 年开始分阶段实施,对「高风险 AI 系统」提出了透明度、可解释性、数据治理和人类监督等一系列要求。对于希望部署 AI 的欧洲企业而言,使用一个出厂即合规的模型,远比自行改造一个黑箱模型更具吸引力。Swisscom 作为战略合作伙伴的加入,进一步表明电信、金融、医疗等受监管行业对合规 AI 基础设施的迫切需求。
合规内置的技术实现:opt-out、PII 移除与防记忆化
Apertus 的 EU AI Act 合规并非停留在文档层面,而是体现在三个具体的技术机制中:
自动 opt-out 处理:欧盟 AI 法案要求模型尊重数据主体的权利,包括从训练数据中删除个人信息。Apertus 在数据预处理阶段就实现了自动化的 opt-out 请求处理管道,确保权利人请求能在训练语料层面得到响应,而非仅在推理层面做文章。
PII(个人身份信息)移除:训练数据经过多层 PII 检测与脱敏,包括命名实体识别(NER)过滤、正则模式匹配和基于语言模型的上下文敏感检测。这并非简单的关键词替换,而是保留语义连贯性的前提下最小化隐私风险。
防止记忆化(anti-memorization):模型记忆训练数据中的长序列是隐私和版权风险的根源。Apertus 在训练过程中引入了去重、近似重复检测和差分隐私训练技术,降低模型逐字复现训练数据的概率。一篇发表于 2026 年 6 月的 arXiv 论文(Output Vector Editing for Memorization Mitigation)也验证了,针对 OLMo-7B 等全开放模型,通过输出向量编辑可以实现最高 87.9% 的记忆化抑制率——这类技术天然适用于 Apertus 这样公开完整权重的模型。
同时,Apertus 采用了 宪法式对齐(constitutional alignment) 策略。另一篇 2026 年 6 月的论文(TreeTracer)在对 Apertus 模型进行偏见审计时,将其描述为「constitutionally aligned Apertus models」,并发现其相比于未对齐的基线模型(GPT-2 XL),在代词抑制和对话边缘化等隐性偏见上表现显著更优。
8B 与 70B:双轨策略覆盖从边缘到云端
Apertus 提供两个规模版本:8B 参数的轻量版和 70B 参数的旗舰版。这种双轨策略在开源模型社区中已被 Llama、Qwen 等系列验证为有效——8B 适合本地部署、边缘推理和学术研究,70B 则面向需要更强推理能力的企业级场景。
从目前已公开的基准来看,Apertus-70B 在医学等专业领域的表现处于全开放模型的前列,而 8B 版本则在推理效率与合规性之间取得了有竞争力的平衡。更重要的是,Apertus 的完全开放性意味着下游开发者可以对其进行无限制的微调、蒸馏和再分发——这在受 EU AI Act 监管的场景中,意味着合规链条的完整性可以从基座模型一直延伸到最终部署的应用。
Hacker News 上的讨论:开源理想遇上监管现实
Apertus 在 Hacker News 上的发布帖引发了技术社区的激烈讨论。讨论的焦点集中在几个方面:一是「全开源」的定义边界——即便 Apertus 公开了训练数据,数据来源的合规性审查是否能做到完全透明?二是 EU AI Act 合规内置是否会造成功能上的「自我审查」,从而削弱模型在开放域对话中的表现力?三是瑞士作为非欧盟成员国,其主导的「主权 AI」项目能否真正代表欧盟的监管立场?
这些问题目前尚无定论,但 Apertus 的出现至少为讨论提供了一个具体的参照物。在此之前,「欧盟 AI 法案合规」更多是一个抽象的法律概念;Apertus 将其转化为了可检验、可复现的工程实践。
展望:合规作为一种竞争力
Apertus 的意义超越了技术本身。它表明,在 AI 治理日趋严格的全球环境中,合规可以成为一种差异化的竞争力。当大多数 AI 公司仍在将监管视为一种成本或障碍时,Apertus 选择将 EU AI Act 的合规要求内化为产品设计的一部分——这或许代表了「负责任 AI」从口号走向工程化的转折点。
对于欧洲企业而言,一个全开源、合规内置、由中立国瑞士主导的基础模型,提供了一条绕开地缘政治风险的 AI 部署路径。而对于全球开源社区,Apertus 则提供了一个检验「真正开源」承诺的试金石:当所有组件都摆在桌面上时,社区能否比闭源模型做得更好?
