本周,全球具身开源领域迎来高光时刻。
蚂蚁集团旗下灵波科技连续四天开源了四款具身领域大模型,分别是:高精度空间感知模型LingBot-Depth、具身 VLA 基座LingBot-VLA、世界模型LingBot-World,以及具身世界模型LingBot-VA,引发了海内外广泛关注。
LingBot-Depth率先引发关注,有分析师称其为“破局一手”,让机器人拥有更好的“眼睛”。
第二天的具身VLA基座模型获大模型学术领域意见领袖AK推荐,在学术圈激起广泛讨论。
随后开源的世界模型LingBot-World以媲美Google Genie 3的性能,让网友直呼“哇塞”:16帧/秒的实时交互模拟,延迟低于1秒,拥有长达1分钟的上下文记忆能力,关键还是开源的,“已经找不到词形容了,只能说太惊艳了。”
Hugging Face CTO 助理 Adina Yakup 也点赞转推:“蚂蚁集团在具身领域模型正火力全开,在推出VLA和空间感知基础模型后,又带来了一款全新的世界模型!”
网友Chubby指出,LingBot-World真正的亮点在于能实现近10分钟的稳定、连续生成,哪怕镜头移开60秒,当镜头再次返回时,场景中的物体依然保持完整。
第四天的LingBot-VA则更是让人看到机器人的未来,将世界模型的“预测”能力,高效、可靠地转化为机器人在物理世界中的“行动”能力,实现从虚拟到现实(即Sim2Real)的跨越,使其在物理世界交互中的决策执行更加准确高效。
在社交媒体广获讨论的同时,蚂蚁集团此次开源也引发了海外媒体的密切关注。特别是LingBot-World,作为谷歌全力押注的基础模型演进方向,迅速引发了多家媒体跟进报道。
(法国游戏评测网站PauseHardware的报道)
法国游戏评测网站PauseHardware指出,如果在长时序一致性和控制能力方面得到验证,LingBot-World将加速推动实时智能体的发展。对产业界而言,这一进展具有双重价值:一方面,可显著降低高质量交互数据的获取成本,另一方面,则能使仿真环境更贴近对游戏玩法和软件机器人至关重要的物理条件,同时确保与用户实际使用需求相匹配的响应延迟。
(AI技术评测网站Gaga.art的报道)
AI技术评测网站Gaga.art在报道中指出,LingBot-World作为一个免费、开源的世界模型,可以根据用户输入生成交互式实时环境,模型生成的质量与Google Genie 3相当,同时完全面向开发者开放。
(德国最大财经网站之一AdHocNew的报道)
德国最大财经网站之一AdHocNew更是给予了高度评价,认为此次开源发布是蚂蚁集团在全球机器人领域主导权争夺战中的一项战略性举措,意味着其正在成为不断增长的人形机器人和物理AI市场中的核心推动者。
AdHocNew采访的一位行业专家表示,LingBot-World的开源对整个行业带来了变革,“此前这类训练环境通常是专有的,成本昂贵。现在,每位开发者都能接触到工业标准技术。”
开源开放探索未来AGI未来边界
蚂蚁灵波科技CEO朱兴表示,蚂蚁集团坚定以开源开放模式探索AGI,为此打造 InclusionAI,构建了涵盖基础模型、多模态、推理、新型架构及具身智能的完整技术体系与开源生态。蚂蚁正通过InclusionAI社区将模型全部开源,和行业共建,探索AGI的边界。
毫无疑问,本周蚂蚁的开源举措对全球具身智能市场的发展将带来深远影响,可以看出,随着LingBot-Depth(空间感知)、LingBot-VLA(智能基座)、LingBot-World(模拟环境)、LingBot-VA(行动指引)四款具身领域大模型的开源发布,意味着蚂蚁的AGI战略实现了从数字世界到物理感知的关键延伸,标志着其“基础模型-通用应用-实体交互”的全栈路径已然清晰。
目前,具身智能领域尚未形成统一共识,仍处于技术路径多元、发展方向探索的早期阶段。不同的公司采取了不同的发展路径,类似特斯拉或波士顿动力这样的欧美公司通常采用封闭系统,中国的蚂蚁集团则走上了与之相反的开源开放道路。
参考近些年包括AI在内的基础软件的发展路径,比如数据领域Databricks、Snowflake、Oracle等巨头都在积极拥抱开源开放的Iceberg,大语言模型在开源开放中等来了DeepSeek时刻。我们有理由相信,开源开放将会加速具身智能领域的创新探索和规模化落地进程。