二维码
×
希鸥网logo

X-Era Lab:在真实世界的混沌中,重塑物理AGI的底层逻辑

作者 / 希鸥网 发布时间 / 2026年06月23日 来源 / 希鸥网 分类 / 产业观察

在通往通用人工智能(AGI)的征途中,横亘着“数字大脑”与“物理身体”之间的巨大鸿沟。2026年6月,X-Era Lab(拓元智慧)首席科学家王可泽团队给出了破局的信号:他们发布了名为“世界动作模型”(World Action Model, WAM)的基座模型。不同于Anthropic等专注于数字世界代码生成的模型,WAM专注于物理世界的交互。团队利用500万次来自真实物理世界的交互数据训练模型,这些数据涵盖了无人零售柜中顾客抓取、挪动商品的随机动作,以及工业场景下的真实反馈。王可泽坚持认为,只有拒绝“表演”式的干净样本,拥抱真实场景中的噪音与混乱,机器才能学会真正的“生存”。

WAM模型的核心突破在于实现了从“看一步走一步”到“预见未来”的跨越。传统的视觉-语言-动作(VLA)范式往往反应迟缓,而WAM实现了“预测-决策”一体化的端到端输出。给定动作前提,模型能同步预测后续的物理过程及环境反馈,仿佛机器人在触碰物体前已在内部“想象”出了后果。王可泽将物理AGI的发展阶段类比为“GPT-2.0到3.0”的时期,认为数据与模型的迭代正呈指数级增长。尽管行业对于“GPT时刻”是否到来尚有争议,但WAM让机器人从单纯执行指令的工具,向理解物理规律的智能体迈出了关键一步。

在数据策略上,X-Era Lab构建了独特的“4D+X”数据闭环。所谓的4D数据,是指在3D空间几何基础上增加了时间维度的动态演化,而“X”则包含了触觉、摩擦力等接触传感器数据及语言标注。这些数据并非来自仿真的实验室环境,而是源自每天数万小时真实业务回流。王可泽指出,目前行业内存在大量依靠仿真轨迹或刻意摆拍的数据泡沫,而X-Era Lab通过真实业务场景——如无人零售和工业分拣——建立了“模型-数据-业务”的正反馈飞轮,这是初创团队对抗大厂算力堆叠的核心壁垒。

目前,该模型已在商业落地方面取得了实质性进展。WAM模型已长期部署在无人零售场景,日均处理近500万次真实服务,并正向工业领域的上下料、线束插拔等半结构化场景延伸。官方宣称,该模型在物理世界交互的能力上已“比肩”国际顶尖水平。与语言大模型在SWE-BenchPro上的高分表现不同,WAM的价值在于解决了物理AGI长期面临的落地难题,证明了物理基座模型不仅能跑通实验室Demo,更能适应真实世界中千变万化的复杂任务。

本篇内容整理自网络,同步发布在 AEX新讯社中文网、希鸥网、斯贝瑞品牌资讯、RCEO创新网、AI联播网、创新日报 等媒体平台。如需删改或发布内容,请联系微信:meisceo29

阅读量:1295
10秒生文 寻求报道 创业大集 报名活动 创业10年荣耀奖 城市合伙人 一站发稿1万家