[印度] 印度工人頭戴攝像頭 邊打工邊教機器人搶自己飯碗
Ego 數據方案把這套流程從根上改了:工人戴上頭頂的攝像頭,綁上腕部的追蹤器(有些方案還會配壹副特制手套)。換裝完畢,正常上工就行。
這叁層設備各有分工。頭戴攝像頭負責記錄第壹視角的完整畫面——操作台的布局、物體的位置、手和目標物之間的空間關系;腕部攝像頭對准手部,專門捕捉手在近距離操作時的細節;穿戴手套則完全不依賴視覺,直接用傳感器測量每根手指的關節角度。

叁層疊加,就還原了壹個完整的操作動作——人的眼睛看到了什麼、手在哪裡、手指該怎麼動。通過這些樣本,機器人可以學習從視覺到動作的映射關系,即看到某個畫面時,應該做些什麼。
這裡面有壹個小 bug,機器人學誰,就像誰。
如果被采集的工人是個熟練工,動作幹脆、力道精准,那機器人學出來的就是壹套行雲流水的操作。可萬壹這位工人習慣摸魚,比如擰螺絲前先撓撓頭,放零件時要抖兩下手腕,甚至壹邊幹活壹邊東張西望……那機器人也會把這些多余的動作當成標准流程學進去。

所以視頻裡,整個車間只有壹排工人頭上戴了攝像頭,或許,他們是整個車間選出來的最好的工人。
還有更簡單粗暴的方式,是只篩選數據,不篩選人。美國有壹家叫做 Generalist AI 的公司,他們用眾包的方式,把低成本穿戴設備分發給世界各地的普通人。不管是你在家折衣服、在廚房洗碗,還是在修車鋪擰螺絲,只要戴上設備,人人皆可邊幹活邊采數據。
業內對此充滿了懷疑,普通人在家裡采出來的數據,質量根本沒法和專業數采中心比,怎麼能訓練出高成功率的模型?
答案是大力出奇跡。海量的原始數據進來,系統自動篩選,低質量的直接丟掉,只留下那些叁層數據對得上的高置信度樣本。數據量足夠大,過濾完還剩得夠多,就能用。

[物價飛漲的時候 這樣省錢購物很爽]
還沒人說話啊,我想來說幾句
這叁層設備各有分工。頭戴攝像頭負責記錄第壹視角的完整畫面——操作台的布局、物體的位置、手和目標物之間的空間關系;腕部攝像頭對准手部,專門捕捉手在近距離操作時的細節;穿戴手套則完全不依賴視覺,直接用傳感器測量每根手指的關節角度。

叁層疊加,就還原了壹個完整的操作動作——人的眼睛看到了什麼、手在哪裡、手指該怎麼動。通過這些樣本,機器人可以學習從視覺到動作的映射關系,即看到某個畫面時,應該做些什麼。
這裡面有壹個小 bug,機器人學誰,就像誰。
如果被采集的工人是個熟練工,動作幹脆、力道精准,那機器人學出來的就是壹套行雲流水的操作。可萬壹這位工人習慣摸魚,比如擰螺絲前先撓撓頭,放零件時要抖兩下手腕,甚至壹邊幹活壹邊東張西望……那機器人也會把這些多余的動作當成標准流程學進去。

所以視頻裡,整個車間只有壹排工人頭上戴了攝像頭,或許,他們是整個車間選出來的最好的工人。
還有更簡單粗暴的方式,是只篩選數據,不篩選人。美國有壹家叫做 Generalist AI 的公司,他們用眾包的方式,把低成本穿戴設備分發給世界各地的普通人。不管是你在家折衣服、在廚房洗碗,還是在修車鋪擰螺絲,只要戴上設備,人人皆可邊幹活邊采數據。
業內對此充滿了懷疑,普通人在家裡采出來的數據,質量根本沒法和專業數采中心比,怎麼能訓練出高成功率的模型?
答案是大力出奇跡。海量的原始數據進來,系統自動篩選,低質量的直接丟掉,只留下那些叁層數據對得上的高置信度樣本。數據量足夠大,過濾完還剩得夠多,就能用。

[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 | 更多... |
推薦:



