揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…
“擎天柱”的数据采集员需要穿戴动作捕捉设备为机器人采集数据,撰写日报,时薪高达48美元(约合344元人民币(专题))
但数据匮乏,是具身智能机器人发展道路上的最大瓶颈。
姚卯青坦言:“机器人的数据太少了,很难跟大语言模型的数量级去相提并论。”究其原因,是因为大语言模型的训练依赖的是互联网上的海量文本,而具身智能机器人依赖的是真实世界的物理交互数据。比如机器人每学倒一次水,都需要采集员记录手臂轨迹、握力变化、水温触感等多维度信息。

擎天柱在工厂装电池
这也意味着真机数据的集采成本高昂。英伟达研究中心的工作人员曾对媒体透露,光让特斯拉的人形机器人“擎天柱”把电池放进盒子这一个动作,就需要40人的团队进行数据集采;如果让擎天柱具备真正的“下厂工作”的能力,需要数百万小时的数据训练,花费至少上亿美元。
为了解决这个困境,全球有多家人形机器人公司开源了自己的数据集,其中就包括国内的智元、傅利叶等公司,希望能够推动行业内的技术共享。

智元机器人通过最新的GO-1通用具身基座大模型,可以完成送餐任务
除了“1V1的人类教学”,还有一种性价比更高的培训方式也在同步进行——通过给机器人“投喂”大量的人类教学视频和图文,帮助它们理解人类的动作操作。
今年3月,智元机器人发布了全国首个“通用具身基座大模型”,通过分析人类家务视频,比如观看短视频网站上的烹饪教程,就可以让机器人在还未进行实操(零样本)的情况下,也能推理出一些做饭的简单常识,比如“水烧开会冒泡”“土豆需要削皮”等等。
人形机器人养老?“现在还停留在概念阶段”

[加西网正招聘多名全职sales 待遇优]
好新闻没人评论怎么行,我来说几句
但数据匮乏,是具身智能机器人发展道路上的最大瓶颈。
姚卯青坦言:“机器人的数据太少了,很难跟大语言模型的数量级去相提并论。”究其原因,是因为大语言模型的训练依赖的是互联网上的海量文本,而具身智能机器人依赖的是真实世界的物理交互数据。比如机器人每学倒一次水,都需要采集员记录手臂轨迹、握力变化、水温触感等多维度信息。

擎天柱在工厂装电池
这也意味着真机数据的集采成本高昂。英伟达研究中心的工作人员曾对媒体透露,光让特斯拉的人形机器人“擎天柱”把电池放进盒子这一个动作,就需要40人的团队进行数据集采;如果让擎天柱具备真正的“下厂工作”的能力,需要数百万小时的数据训练,花费至少上亿美元。
为了解决这个困境,全球有多家人形机器人公司开源了自己的数据集,其中就包括国内的智元、傅利叶等公司,希望能够推动行业内的技术共享。

智元机器人通过最新的GO-1通用具身基座大模型,可以完成送餐任务
除了“1V1的人类教学”,还有一种性价比更高的培训方式也在同步进行——通过给机器人“投喂”大量的人类教学视频和图文,帮助它们理解人类的动作操作。
今年3月,智元机器人发布了全国首个“通用具身基座大模型”,通过分析人类家务视频,比如观看短视频网站上的烹饪教程,就可以让机器人在还未进行实操(零样本)的情况下,也能推理出一些做饭的简单常识,比如“水烧开会冒泡”“土豆需要削皮”等等。
人形机器人养老?“现在还停留在概念阶段”

[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
推荐:
揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…