揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…
位于上海浦东的智元数据集采厂,总面积达3000多平方米
在上海浦东,一个3000平米的机器人“训练基地”里,一百多台人形机器人日日夜夜地接受超高强度的集训。
这些机器人像懵懂的人类幼仔一样,通过触摸、试错感知物理世界:在卧室区叠裤子、烫衣服,在厨房炒菜、榨果汁、刷盘子,在客厅插花、拖地板、整理杂乱的桌面……每个机器人身边都配备了一名“导师”——头戴VR设备的数据采集员,他们用手柄远程示范动作,给机器人示范动作,抓、握、提、拉、倒,一个小动作要不厌其烦地重复200遍左右。

数据集采员耐心“教授” 机器人每一个动作
这是智元的数据采集超级工厂,也是全球唯二规模化的机器人数据采集中心。整个工厂分为5大类场景:家居、餐厅、工业、商超和办公,总共有100位采集员分日班和夜班教学,此外,还有30多位数据审核员和10位数据运营管理人员,确保数据的有效性。
一天下来,工厂能够生产3万到5万条真机数据——即通过机器人实操采集到的环境感知、动作轨迹、力学反馈等包含多维度信息的数据。
有时候,机器人也会“开小差”,水壶没拿稳、炒菜调料撒多了、花瓶打翻了……数采员就会耐心地给它们纠错。

机器人在练习刷马桶
这些机器人训练成果如何?姚卯青介绍:“现在仍处在比较早期的阶段,一个机器人在它见过的桌面上倒水,有90%左右的成功率。”对于它没见过的场景和物品,机器人可能就会措手不及。另外,这些动作主要还是一些单点的能力,还不太能串起来多种动作。
为了让机器人拥有在不同场景里“举一反三”的泛化能力,采集员要不断地调试环境,比如改变光线和光源位置,倒水时更换不同造型的水杯,调整物体摆放的位置等等。
数据采集,是构建机器人“AI能力”(“脑力”)的基础工程。通过收集视觉、触觉、关节运动轨迹等多维度物理交互数据,然后再给多模态大模型提供认知养料,最终才能被部署到机器人本体,完成从数字认知到物理执行的闭环进化。

[加西网正招聘多名全职sales 待遇优]
还没人说话啊,我想来说几句
在上海浦东,一个3000平米的机器人“训练基地”里,一百多台人形机器人日日夜夜地接受超高强度的集训。
这些机器人像懵懂的人类幼仔一样,通过触摸、试错感知物理世界:在卧室区叠裤子、烫衣服,在厨房炒菜、榨果汁、刷盘子,在客厅插花、拖地板、整理杂乱的桌面……每个机器人身边都配备了一名“导师”——头戴VR设备的数据采集员,他们用手柄远程示范动作,给机器人示范动作,抓、握、提、拉、倒,一个小动作要不厌其烦地重复200遍左右。

数据集采员耐心“教授” 机器人每一个动作
这是智元的数据采集超级工厂,也是全球唯二规模化的机器人数据采集中心。整个工厂分为5大类场景:家居、餐厅、工业、商超和办公,总共有100位采集员分日班和夜班教学,此外,还有30多位数据审核员和10位数据运营管理人员,确保数据的有效性。
一天下来,工厂能够生产3万到5万条真机数据——即通过机器人实操采集到的环境感知、动作轨迹、力学反馈等包含多维度信息的数据。
有时候,机器人也会“开小差”,水壶没拿稳、炒菜调料撒多了、花瓶打翻了……数采员就会耐心地给它们纠错。

机器人在练习刷马桶
这些机器人训练成果如何?姚卯青介绍:“现在仍处在比较早期的阶段,一个机器人在它见过的桌面上倒水,有90%左右的成功率。”对于它没见过的场景和物品,机器人可能就会措手不及。另外,这些动作主要还是一些单点的能力,还不太能串起来多种动作。
为了让机器人拥有在不同场景里“举一反三”的泛化能力,采集员要不断地调试环境,比如改变光线和光源位置,倒水时更换不同造型的水杯,调整物体摆放的位置等等。
数据采集,是构建机器人“AI能力”(“脑力”)的基础工程。通过收集视觉、触觉、关节运动轨迹等多维度物理交互数据,然后再给多模态大模型提供认知养料,最终才能被部署到机器人本体,完成从数字认知到物理执行的闭环进化。

[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
推荐:
揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…