2026 年 6 月 17 日,世界模型初创公司 Odyssey 宣布完成 3.1 亿美元 B 轮融资,估值达到 14.5 亿美元。这轮融资由 Natural Capital 领投,Amazon、AMD Ventures、GV(Google Ventures)、EQT 以及 CIA 关联的战略投资机构 IQT(In-Q-Tel)参投。至此,这家由自动驾驶老将创立、成立仅三年的公司,累计融资额达到 3.37 亿美元。
Odyssey 的 CEO Oliver Cameron 和 CTO Jeff Hawke 均来自自动驾驶领域:Cameron 曾创办自动驾驶公司 Voyage(后被 GM Cruise 收购),Hawke 则是英国自动驾驶明星公司 Wayve 的创始工程师。他们在自动驾驶系统中看到了"世界预测"的巨大潜力——一个能从道路视角学习物理规律、因果关系和动态行为的模型——并相信同样的思想可以推广到远超自动驾驶的领域。
世界模型:从预测文字到模拟物理
理解 Odyssey 的融资逻辑,首先要理解"世界模型"是什么。
与 LLM 预测下一个 token 不同,世界模型预测的是物理世界的下一个状态。它接收当前的环境观察和用户输入,输出下一帧画面——逐帧滚动,形成连续、可交互的模拟。这种"自回归下一状态预测"迫使模型内化物理规律:物体如何运动、碰撞、变形的知识隐含在预测任务中,而非手动编码。
Cameron 在官方博客中写道:"我们相信,世界模型正在逼近自己的 GPT-3 时刻——从有前景的研究方向转变为突破性的基础技术。"
Odyssey 已发布多款世界模型:Odyssey-2 Max 在 VBench 2 物理评分上达到 58.52,领先所有被评估的世界模型;Starchild-1 是首个实时多模态世界模型,支持音视频同步生成;Agora-1 实现了多智能体共享世界模拟;PROWL 则通过强化学习对抗框架,让模型主动探索并改进自身弱点。
背着相机采集世界:像 Google Earth 一样造数据
Odyssey 最与众不同的地方在于其数据采集方式。
与大多数 AI 公司依赖互联网抓取数据不同,Odyssey 设计了一套重约 25 磅(约 11 公斤)的背包式采集系统,搭载六台摄像头、两个激光雷达传感器和一个惯性测量单元,能以 360 度、3.5K 分辨率捕捉物理环境,并附带物理精度的深度信息。采集人员背着这套设备徒步穿越森林、洞穴、海滩、冰川、城市街道——方式类似于 Google 街景的 Trekker 背包,但目标完全不同。
"我们认为,如果不基于大量丰富、多模态的真实世界 3D 数据训练,生成模型不可能创造出好莱坞级别的、有生命力的世界,"Odyssey 在 2024 年的博客中写道。
这一策略的深层逻辑在于:世界模型需要的不是更多文本,而是物理世界的直接观测。互联网上的视频虽然海量,但缺乏深度信息、物理元数据和可控视角。自主采集则能获得高质量、结构化、物理标注完备的训练数据——这恰恰是自动驾驶背景的创始团队最擅长的领域。
投资方阵容的潜台词
Odyssey 本轮融资的投资方组合值得逐家拆解,因为每一家都透露出行业格局的关键信号。
Natural Capital 作为领投方,其 GP Jay Zaveri 称这是该基金迄今最大的一笔投资,并表示"Odyssey 有潜力定义语言模型之外的 AI"。这一定位本身就是一个重要的市场信号。
Amazon 的参投附带了明确的商业条款:Odyssey 承诺将 AWS 作为优先云平台,并将模型优化适配 AWS 自研的 Trainium 芯片。Amazon VP Ron Diamant 在官方声明中表示:"世界模型是 AI 中对计算要求最高的工作负载之一——需要大规模计算吞吐量和严格的延迟约束。Trainium 正是为这种规模而构建的。"这标志着一种新的融资模式:超大规模云厂商通过战略投资附带云计算锁定条款,以自研芯片替代 NVIDIA GPU,从而在 AI 基础设施竞争中建立差异化优势。
AMD Ventures 的参与同样值得关注。在 NVIDIA 几乎垄断 AI 训练芯片的格局下,AMD 通过投资初创公司来培育 GPU 替代需求,是其生态战略的延伸。
GV(Google Ventures) 代表的是 Google 生态的触角。GV 合伙人 Luna Schmid 表示:"Oliver 和 Jeff 比任何人都更早看到了趋势:他们用来教汽车导航的 AI 可以学习模拟整个世界。世界模型现在已经是一个数十亿美元的品类。"
IQT(In-Q-Tel) 的参与则是最具地缘政治含义的一笔。IQT 是 CIA 于 1999 年设立的非营利战略投资机构,使命是将私营部门的尖端技术引入美国情报与国防体系。其投资组合包括 Palantir、GitLab、Cerebras 等。IQT 投资 Odyssey 表明,世界模型在国防和情报领域的应用前景——从战场模拟到城市环境推演——已被美国国家安全体系正式纳入视野。
市场预期:从 18 亿到 527 亿美元
世界模型市场的增长预期惊人。据 Kaiso Research 数据,全球 AI 世界模型市场 2025 年估值为 18 亿美元,预计到 2035 年将达到 527 亿美元,年复合增长率(CAGR)高达 40.2%。
推动这一增长的核心驱动力来自多个方向:机器人需要世界模型在部署前进行大规模模拟训练;自动驾驶需要世界模型生成极端边缘场景;游戏和影视需要世界模型替代手工搭建的 3D 环境;科学研究需要世界模型模拟分子结构、气候系统和医疗场景。
竞争格局:巨头与明星创业公司的围猎
世界模型赛道正在迅速升温,Odyssey 并非孤军奋战。
World Labs(Fei-Fei Li 创立)于 2025 年 11 月推出 Marble,是首个商业化世界模型产品,支持从文本、照片、视频生成可编辑的 3D 环境,定价从免费到 95 美元/月。World Labs 已累计融资约 2.3 亿美元。
AMI Labs(Yann LeCun 创立)在 2025 年底从 Meta 离职后成立,寻求以 30 亿欧元估值融资 5 亿欧元,目标是基于 I-JEPA 架构构建理解物理世界的 AI 系统。
Google DeepMind 的 Genie 3 于 2025 年 8 月发布,是首个实时交互式通用世界模型,能以 24 fps 生成 720p 的可导航 3D 环境,物理规律完全从训练中涌现。
NVIDIA Cosmos 面向工业级物理 AI,截至 2026 年 1 月下载量超过 200 万次,被 1X、Agility、Figure AI、Waabi、Uber 等公司采用。
Physical Intelligence 则专注于机器人基础模型,2025 年 11 月以 56 亿美元估值完成融资,其 π-zero 系统在真实工厂中实现了超过 90% 的任务成功率。
Runway 的 Gen-4.5 在 Video Arena 基准测试中排名第一,明确将自己定位为"理解物理的世界模型"而非单纯的视频生成工具。
AWS Trainium 绑定:云计算的新筹码
Odyssey 与 Amazon 的合作揭示了一种正在成型的行业模式:超大规模云厂商通过战略投资,以云计算资源和自研芯片锁定 AI 初创公司。
Trainium 是 AWS 自研的 AI 训练芯片,目前已是第二代(Trainium2),Annapurna Labs 主导设计。与 NVIDIA H100 相比,Trainium 在成本上具有显著优势——AWS 官方宣称 Trainium2 实例相比上一代 GPU 实例提供 30-40% 的性价比提升。Anthropic 已在其"Project Rainier"集群中部署近 50 万颗 Trainium2 芯片。
对于 Odyssey 这类需要海量计算资源训练世界模型、运行实时推理的初创公司而言,接受 AWS 的战略投资意味着获得优先且优惠的算力供给——而代价是生态锁定。这种模式正在成为 AI 融资的新常态:大模型时代的"融资-采购-绑定"循环,已经延伸到了世界模型赛道。
这一趋势的另一个信号是:Odyssey 在四个月前刚刚获得 NVIDIA 旗下 NVentures 的 A 轮投资,如今却转向 AWS Trainium。这表明即便有 NVIDIA 的投资关系,模型公司仍然会基于成本和供给弹性做出芯片选择——而 AWS 正是利用这一点,通过资本手段切入 NVIDIA 的客户群。
结语
Odyssey 的 3.1 亿美元 B 轮融资,本质上是一场关于 AI 下一阶段的押注。当 LLM 的扩展红利逐渐被消化,投资者和科技巨头正在寻找新的范式。世界模型代表了从"理解语言"到"理解物理"的跨越——这不是对 LLM 的否定,而是 AI 能力的维度扩展。
Odyssey 团队在博客中写道:"我们仍处于最早期的阶段,但前方的机会是巨大的。我们迫不及待地想要探索,当 AI 能够理解和模拟世界时,什么将成为可能。"
世界模型是否会像 LLM 一样引发一场产业革命,答案尚不可知。但 3.1 亿美元的支票已经投下——而站在它背后的,是 Amazon 的芯片、AMD 的雄心、GV 的生态、CIA 的视野,以及一个从 18 亿奔向 527 亿美元的市场预期。

