机器人学习也要提速提质!智元机器人发布首个通用具身基座大模型
csdh11 2025-05-10 20:53 3 浏览
去年已实现量产近千台的人形机器人公司智元机器人再度对外宣布重磅消息。
3月10日,该公司正式发布首个通用具身基座大模型,即智元启元大模型(Genie Operator-1)。“GO-1大模型借助人类和多种机器人数据,让机器人获得了革命性的学习能力,可泛化应用到各类的环境和物品中,快速适应新任务、学习新技能。”
值得关注的是,智元机器人方面介绍,GO-1大模型还支持部署到不同的机器人本体,高效地完成落地,并在实际的使用中持续不断地快速进化。
2024年底,智元机器人年推出了AgiBot World,包含超过100万条轨迹、涵盖217个任务、涉及五大场景的大规模高质量真机数据集。然而,如何有效利用高质量的AgiBot World数据集以及互联网大规模异构视频数据?这仍然是关键。
智元介绍,数字金字塔的底层是互联网的大规模纯文本与图文数据,可以帮助机器人理解通用知识和场景;在这之上是大规模人类操作/跨本体视频,可以帮助机器人学习人类或者其他本体的动作操作模式;更上一层则是仿真数据,用于增强泛化性,让机器人适应不同场景、物体等;金字塔的顶层,则是高质量的真机示教数据,用于训练精准动作执行。
“现有的VLA(Vision-Language-Action)架构,未有利用到数字金字塔中大规模人类/跨本体操作视频数据,缺少了一个重要的数据来源,导致迭代的成本更高,进化的速度更慢。”基于这一现实,智元此次提出了
Vision-Language-Latent-Action(ViLLA)架构。
据介绍,该架构由VLM(多模态大模型)+ MoE(混合专家)组成。其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)则借助百万真机数据获得精细的动作执行能力。
也就是说,与VLA架构相比,ViLLA通过预测Latent Action Tokens(隐式动作标记),弥合了图像-文本输入与机器人执行动作之间的鸿沟,能有效利用高质量的AgiBot World数据集以及互联网大规模异构视频数据,增强策略的泛化能力。
智元机器人称,在推理时,VLM、Latent Planner和Action Expert三者协同工作:VLM 采用InternVL-2B,接收多视角视觉图片、力觉信号、语言输入等多模态信息,进行通用的场景感知和指令理解;Latent Planner是MoE中的一组专家,基于VLM的中间层输出预测Latent Action Tokens作为CoP(Chain of Planning,规划链),进行通用的动作理解和规划;Action Expert是MoE中的另外一组专家,基于VLM的中间层输出以及Latent Action Tokens,生成最终的精细动作序列。
“实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体,持续进化,将具身智能推上一个新台阶。”智元机器人方面表示。
根据该公司给出的数据,通过
Vision-Language-Latent-Action (ViLLA) 架构,其在五种不同复杂度的任务上测试 GO-1,相比已有的最优模型,GO-1平均成功率提高了32%(46%->78%)。其中 “Pour Water”(倒水)、“Table Bussing”(清理桌面) 和 “Restock Beverage”(补充饮料) 任务表现尤为突出。此外还单独验证了ViLLA 架构中Latent Planner的作用,其可以提升12%的成功率(66%->78%)。
智元机器人称,智元通用具身基座大模型GO-1的推出,标志着具身智能向通用化、开放化、智能化方向快速迈进。
智元机器人于2023年2月成立于上海临港新片区,其临港工厂也已于2024年10月开始生产,这也是上海首座人形机器人量产工厂。据悉,智元机器人还计划在上海张江建设年产能在1万台左右的人形机器人的二期工厂。截至目前,该公司主要有三条主打产品线,分别为远征、Genie和灵犀。
澎湃新闻记者 贺梨萍
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
相关推荐
- 全能硬件大师AIDA64 v4.60 最新绿色版下载
-
IT之家(www.ithome.com):全能硬件大师AIDA64v4.60最新绿色版下载今天,国外FinalWire公司正式发布全能系统硬件大师AIDA64v4.60最新版。本次新版加入14款...
- 2023年4款Mac软件推荐,绝不失望(mac2020i3)
-
1.VDown-免费下载视频是最近mac上出现的免费的视频下载软件,支持超过900多个站点,虽然看上去支持的站点略少于Downie,但是熟悉的网站B站,Youku全部都有,国外的站点,只要有办法访问...
- 实验设计和数据分析必不可少的Design-expert,谁还不会用呢?
-
Design-Expert软件介绍...
- 关于视频格式的那些事儿(视频格式作用)
-
闲暇之余,相信很多人的选择就是看视频。电视剧、综艺、手机短视频,总有一款适合你。然而播放这些视频时,你是否注意到了文件名后各种各样的后缀名了呢?是否会好奇为什么会存在这么多视频格式?不同的格式是不是影...
- 机器人学习也要提速提质!智元机器人发布首个通用具身基座大模型
-
去年已实现量产近千台的人形机器人公司智元机器人再度对外宣布重磅消息。3月10日,该公司正式发布首个通用具身基座大模型,即智元启元大模型(GenieOperator-1)。“GO-1大模型借助人类和多...
- 软网推荐:硬盘管理用好Macrorit Partition Expert
-
平时我们经常需要对硬盘进行管理,比如为了释放空间,需要将隐藏分区删除并重建分区;出于隐私保护,需要彻底删除硬盘分区上的数据;硬盘出现坏道需要将其屏蔽等等。诸如此类的操作,现在借助免费且图形化操作的分区...
- Design-Expert 12.0 安装教程(附安装包下载)
-
Design-Expert12.0软件介绍是一款由Stat-EaseInc开发的专用于执行实验设计(DOE)的软件。它提供比较测试、筛选、表征、优化、稳健的参数设计、混合物设计和组合设计等功能,并...
- 不用在PLC内编程,实现西门子与罗克韦尔(AB)PLC之间数据通讯
-
巨控NET400数据网关支持多种PLC之间、PLC与智能仪表之间多对多通讯,支持以太网,串口设备混合数据交换;无需PLC内编程开发,只需在智能网关的参数管理软件上配置数据的起始地址和数量即可,支持热插...
- S7-1500PLC做OPC UA通信服务器(s7-1200 opc ua)
-
OPCUA概述OPCUA是一项开放标准,适用于从机器到机器间(M2M)的水平通信和从机器直到云端的垂直通信。该标准独立于供应商和平台,支持广泛的安全机制,并且可以与PROFINET共享同一工...
- WINCC配置OPC UA服务器的步骤和故障解决
-
WINCC配置OPCUA服务器的步骤和故障解决本次配置实例的环境:在同一局域网内的两台计算机,均为windows7SP1系统一台计算机安装wincc7.4,并建立项目,项目在运行状态一台计算机安...
- 视频格式在线转换,五种超实用的视频格式转换工具!
-
视频内容无处不在,从教育课程到娱乐电影,从社交媒体分享到在线会议,视频已成为我们日常生活中不可或缺的一部分。然而,不同的设备和平台支持的视频格式各异,会导致视频文件在某些设备上无法播放。因此,掌握视频...
- 支持裸眼3D:长虹X1手机/全新CHIQ电视发布
-
IT之家讯10月16日消息国产传统家电品牌长虹此前也一直有智能手机产品,但关注度并不高。今天下午,长虹举行发布会,发布了两款以裸眼3D技术为卖点的产品,分别为长虹X1手机和全新CHIQ曲面电视。长...
- h265和h264有什么区别(h265和h264有什么区别)
-
目前很多摄像机采用了H.265的编码标准,H.264编码的摄像机逐渐减少,为什么H.265会流行?H.264和H.265有何不同?一、什么是H.265...
- 中文白皮书:面向视频编解码器和图形引擎的前沿多媒体方案 WP497
-
该白皮书探讨了ZynqUltraScale+MPSoC的多媒体功能。MPSoC基于Zynq-7000SoC,包括一个可编程逻辑(PL)的桥接处理系统(PS),但它在ZynqUltr...
- 科达NVR家族换新装:推出首款通用型H.265+4K NVR
-
近期,科达推出业内首款通用型H.265+4KNVR——NVR1821,吹响NVR家族全面升级的号角。据了解,保持原有通用型产品“高性价比”定位的基础上,全新NVR1821系列增加了4路4K解码+1路...
- 一周热门
- 最近发表
-
- 全能硬件大师AIDA64 v4.60 最新绿色版下载
- 2023年4款Mac软件推荐,绝不失望(mac2020i3)
- 实验设计和数据分析必不可少的Design-expert,谁还不会用呢?
- 关于视频格式的那些事儿(视频格式作用)
- 机器人学习也要提速提质!智元机器人发布首个通用具身基座大模型
- 软网推荐:硬盘管理用好Macrorit Partition Expert
- Design-Expert 12.0 安装教程(附安装包下载)
- 不用在PLC内编程,实现西门子与罗克韦尔(AB)PLC之间数据通讯
- S7-1500PLC做OPC UA通信服务器(s7-1200 opc ua)
- WINCC配置OPC UA服务器的步骤和故障解决
- 标签列表
-
- mydisktest_v298 (34)
- document.appendchild (35)
- 头像打包下载 (61)
- acmecadconverter_8.52绿色版 (39)
- word文档批量处理大师破解版 (36)
- server2016安装密钥 (33)
- mysql 昨天的日期 (37)
- parsevideo (33)
- 个人网站源码 (37)
- centos7.4下载 (33)
- mysql 查询今天的数据 (34)
- intouch2014r2sp1永久授权 (36)
- 先锋影音源资2019 (35)
- jdk1.8.0_191下载 (33)
- axure9注册码 (33)
- pts/1 (33)
- spire.pdf 破解版 (35)
- shiro jwt (35)
- sklearn中文手册pdf (35)
- itextsharp使用手册 (33)
- 凯立德2012夏季版懒人包 (34)
- 冒险岛代码查询器 (34)
- 128*128png图片 (34)
- jdk1.8.0_131下载 (34)
- dos 删除目录下所有子目录及文件 (36)