人形機器人把老人嚇進醫院 舉手"投降"被警方帶走
截圖自IEEE Spectrum
然而,這台涉事G1不是來炫技的,實則是壹名“打工人”。 它隸屬於澳門壹家教育中心,長期用於宣傳活動。該中心負責人托溫·馬克(Towin Mak)解釋稱,G1當時處於混合編程與遠程監督控制模式下運行。
事實上,G1頭部搭載了深度攝像頭與3D激光雷達(LiDAR),具備實時環境感知能力。當晚,它早已識別出前方老人的輪廓。但當老人突然停下看手機、擋住其行進路線時,機器人的路徑規劃算法將該障礙判定為“不可逾越”,隨即按程序停在原地等待。
問題在於——這種“被動靜止”在缺乏溝通信號的情況下,極易被人類誤解為“尾隨”或“跟蹤”,從而引發恐慌。
表面看,G1顯得“木訥呆滯”;實則,它能在動態環境中穩定行走,並在障礙出現時及時制動,依賴的是強化學習(Reinforcement Learning)。然而,它的“智能”仍相當初級。
正如專注人工智能的科技博主拉胡爾·馬爾霍特拉(Rahul Malhotra,曾是壹名粒子物理學家)所指出:G1在演示中展現的回旋踢、拳擊等動作雖流暢且具爆發力,但這些僅屬於機器人大腦堆棧中最底層的身體控制層(Body Controller)。這些行為並非自主決策,而是通過行為克隆(Behavior Cloning)實現——即人工采集人類動作數據,再以監督學習方式訓練機器人復現。此類展示雖視覺震撼,卻缺乏認知、意圖與推理能力,距離真正的“自主智能”仍有本質差距。
更值得注意的是,當G1從舞台轉入工廠場景執行實際任務時,動作往往變得生硬而遲緩。馬爾霍特拉解釋道:同壹台機器人在不同視頻中表現懸殊,很可能是因為激活了大腦堆棧的不同層級。他將當前人形機器人的智能架構劃分為肆個層次(由低到高):身體控制層(Body Controller,保持整體平衡)、行動策略層(Action Policy,實時生成抓取與放置動作)、感知層(Perception,識別物體、估算位置)、計劃層(Planner,負責拆解任務、邏輯決策)。
目前,絕大多數人形機器人仍主要運行在第壹、贰層。而要實現真正意義上的具身智能(Embodied AI),關鍵瓶頸恰恰在於如何構建更高階的感知-規劃閉環——讓機器人不僅“會動”,更能“會想”。
人機溝通
回到澳門街頭那起引人關注的事件:當G1機器人被警方帶離現場時,涉事老人感覺身體不適,隨即被緊急送醫。所幸檢查後並無大礙,她很快出院,並明確表示不予追究,也不會提出投訴。
然而,這場看似“有驚無險”的小插曲,實則是人形機器人加速融入公共空間的壹個標志性縮影。早在2025年底,深圳“世界之窗”景區就已出現T800型號機器人與民警並肩巡邏;在上海黃浦區,名為“小滬”的人形機器人也曾現身街頭,揮動機械臂協助交通疏導。隨著核心零部件成本下降與產業鏈日趨成熟,人形機器人正從實驗室裡的昂貴展品,轉變為教育機構、商場乃至個人用戶可負擔的實用設備。技術的民主化,意味著人機共處的日常摩擦,才剛剛開始。
問題在於:人類在公共空間中穿行時,會本能地通過眼神微調、身體重心偏移,甚至壹聲輕咳來傳遞意圖——這些微妙的非語言信號構成了社會協作的“隱形協議”。而人形機器人恰恰缺乏這種溝通能力。正如《MIT技術評論》作者維多利亞·特克(Victoria Turk)在2025年所指出:“若要真正與人類共享空間,機器人不僅需預判他人路徑,更必須以所有人都能理解的方式清晰表達自身意圖——無論是通過手勢、聲音、燈光,還是擬人化的微表情與姿態。”
澳門事件恰恰暴露了這壹缺失:G1只是按程序停下,卻無法“示意”自己並非尾隨。它沒有眨眼、沒有退讓、沒有發出提示音——在人類眼中,這種沉默便成了威脅。未來的機器人不僅要學會優雅地行走,更要學會“禮貌地聲明”自己的存在。

[加西網正招聘多名全職sales 待遇優]
無評論不新聞,發表壹下您的意見吧
然而,這台涉事G1不是來炫技的,實則是壹名“打工人”。 它隸屬於澳門壹家教育中心,長期用於宣傳活動。該中心負責人托溫·馬克(Towin Mak)解釋稱,G1當時處於混合編程與遠程監督控制模式下運行。
事實上,G1頭部搭載了深度攝像頭與3D激光雷達(LiDAR),具備實時環境感知能力。當晚,它早已識別出前方老人的輪廓。但當老人突然停下看手機、擋住其行進路線時,機器人的路徑規劃算法將該障礙判定為“不可逾越”,隨即按程序停在原地等待。
問題在於——這種“被動靜止”在缺乏溝通信號的情況下,極易被人類誤解為“尾隨”或“跟蹤”,從而引發恐慌。
表面看,G1顯得“木訥呆滯”;實則,它能在動態環境中穩定行走,並在障礙出現時及時制動,依賴的是強化學習(Reinforcement Learning)。然而,它的“智能”仍相當初級。
正如專注人工智能的科技博主拉胡爾·馬爾霍特拉(Rahul Malhotra,曾是壹名粒子物理學家)所指出:G1在演示中展現的回旋踢、拳擊等動作雖流暢且具爆發力,但這些僅屬於機器人大腦堆棧中最底層的身體控制層(Body Controller)。這些行為並非自主決策,而是通過行為克隆(Behavior Cloning)實現——即人工采集人類動作數據,再以監督學習方式訓練機器人復現。此類展示雖視覺震撼,卻缺乏認知、意圖與推理能力,距離真正的“自主智能”仍有本質差距。
更值得注意的是,當G1從舞台轉入工廠場景執行實際任務時,動作往往變得生硬而遲緩。馬爾霍特拉解釋道:同壹台機器人在不同視頻中表現懸殊,很可能是因為激活了大腦堆棧的不同層級。他將當前人形機器人的智能架構劃分為肆個層次(由低到高):身體控制層(Body Controller,保持整體平衡)、行動策略層(Action Policy,實時生成抓取與放置動作)、感知層(Perception,識別物體、估算位置)、計劃層(Planner,負責拆解任務、邏輯決策)。
目前,絕大多數人形機器人仍主要運行在第壹、贰層。而要實現真正意義上的具身智能(Embodied AI),關鍵瓶頸恰恰在於如何構建更高階的感知-規劃閉環——讓機器人不僅“會動”,更能“會想”。
人機溝通
回到澳門街頭那起引人關注的事件:當G1機器人被警方帶離現場時,涉事老人感覺身體不適,隨即被緊急送醫。所幸檢查後並無大礙,她很快出院,並明確表示不予追究,也不會提出投訴。
然而,這場看似“有驚無險”的小插曲,實則是人形機器人加速融入公共空間的壹個標志性縮影。早在2025年底,深圳“世界之窗”景區就已出現T800型號機器人與民警並肩巡邏;在上海黃浦區,名為“小滬”的人形機器人也曾現身街頭,揮動機械臂協助交通疏導。隨著核心零部件成本下降與產業鏈日趨成熟,人形機器人正從實驗室裡的昂貴展品,轉變為教育機構、商場乃至個人用戶可負擔的實用設備。技術的民主化,意味著人機共處的日常摩擦,才剛剛開始。
問題在於:人類在公共空間中穿行時,會本能地通過眼神微調、身體重心偏移,甚至壹聲輕咳來傳遞意圖——這些微妙的非語言信號構成了社會協作的“隱形協議”。而人形機器人恰恰缺乏這種溝通能力。正如《MIT技術評論》作者維多利亞·特克(Victoria Turk)在2025年所指出:“若要真正與人類共享空間,機器人不僅需預判他人路徑,更必須以所有人都能理解的方式清晰表達自身意圖——無論是通過手勢、聲音、燈光,還是擬人化的微表情與姿態。”
澳門事件恰恰暴露了這壹缺失:G1只是按程序停下,卻無法“示意”自己並非尾隨。它沒有眨眼、沒有退讓、沒有發出提示音——在人類眼中,這種沉默便成了威脅。未來的機器人不僅要學會優雅地行走,更要學會“禮貌地聲明”自己的存在。

[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
推薦:
人形機器人把老人嚇進醫院 舉手"投降"被警方帶走