科技日报记者 华凌
近日,北京人形呆板人立异中央开源全新具出身界模子WoW(World-Omniscient World Model),霸占呆板人理解物理世界的焦点难题,获Huggingface官方盛赞和斯坦福等学界援用,标记我国于该范畴跻出身界前列。

相较在仅能“看世界”的Sora系列,WoW实现从“不雅察”到“理解”的超过,构建交融视觉、动作、物理感知与推理的同一框架。其焦点冲破于在四年夜技能组件:DiT世界天生基座模子作为“物理引擎+想象体系”,从200万条高质量交互轨迹中进修物理纪律;FM-IDM逆动力学模子实现“视频到动作”闭环,能从视觉猜测反推可履行的呆板人运动指令;SOPHIA范式经由过程“天生-攻讦-批改”迭代轮回,模仿人类智能的反思历程;全世界首个具出身界模子基准WoWBench,则成立起感知理解、猜测推理等四年夜维度的量化评估尺度。
实测显示,WoW于物理一致性上上风显著,繁杂动力学场景体现领先,驱念头器人完成简朴使命乐成率达94.5%,中等难度使命乐成率75.2%,天生动作可直接部署在真实机械臂。这次开源涵盖1.3B至14B参数的预练习模子、推理代码等,年夜幅降低行业研究门坎。
作为“最能跑、最佳用”的技能延长,WoW模子可赋能呆板人自立完成抓取、装置等使命,还有能实现数据自天生与优化。这一冲破进一步夯实北京人形呆板人立异中央的技能领先职位地方,加快具身智能呆板人落地运用。
-milan米兰中国分享