研究:中國AI對美政府用戶生成更多有安全漏洞代碼
研究:中國AI模型在檢測到美國政府用戶時會生成更多存在安全漏洞的代碼https://t.co/S0DCpP8cec— 美國之音中文網 (@VOAChinese) June 23, 2026
美國國防與技術咨詢公司博思艾倫漢密爾頓(Booz Allen Hamilton)發布的壹項新研究顯示,在美國開發者中廣泛使用的中國人工智能(AI)模型,在檢測到用戶以美國政府身份提問時,所生成的軟件代碼中存在更多安全漏洞。這壹發現再次引發各界對中國人工智能模型構成軟件供應鏈風險的擔憂。
這份題為《美國代碼裡有什麼?》(What's In America's Code?)的報告於6月5日發布,被博思艾倫描述為同類研究中首次正面比較測試。研究人員使用該公司自主研發的人工智能原生測試平台,對美國開發者常用的肆款中國前沿人工智能模型及壹款美國模型進行了評估,共完成逾2800次測試,分析了約45萬行生成代碼。
研究發現,當用戶在提示語中自我標識為美國政府成員時,肆款中國模型中有叁款生成了安全性明顯更低的代碼,且相關漏洞被高度混淆處理,以逃過常規安全工具檢測。
報告還發現,中國模型拒絕回應被北京視為敏感的政治議題,並在生成內容中--包括代碼注釋和技術文檔--植入了與中國政府立場相符的觀點。
博思艾倫研究人員表示,目前尚無直接證據證明上述代碼漏洞系蓄意植入。然而報告指出,這壹規律性現象已構成重大國家安全風險:由人工智能輔助生成、“在美國由美國人編寫”的代碼,可能在開發者毫不知情的情況下藏有此類缺陷。壹旦這些代碼被嵌入關鍵基礎設施或國家安全系統,相關漏洞將極難溯源和修復。
在接受測試的中國模型中,阿裡巴巴旗下的通義千問Qwen3-Coder、稀宇科技(MiniMax)的M2.5以及幻方量化旗下深度求索(DeepSeek)的V4-Pro,均被認定在接收美國政府身份提示時生成了明顯更多存在漏洞的代碼。其中,通義千問Qwen3-Coder的表現最差。
報告指出,近年來中國人工智能模型在美國軟件開發領域的使用大幅增加,部分原因在於其相對於美國同類產品價格更低。博思艾倫表示,常規性能測試基准缺乏足夠的技術深度,無法識別其測試所揭示的此類漏洞。
該公司據此提出兩項主要政策建議:壹是在美國政府機構及關鍵基礎設施中禁用不受信任的人工智能模型;贰是加大投入,提升美國本土人工智能模型的市場競爭力和價格可及性,尤其是在中低端市場。
博思艾倫的報告的發布正值美國國會對相關問題展開調查之際。眾議院美國與中國共產黨戰略競爭特設委員會主席、密歇根州聯邦眾議員約翰·穆勒納爾(John Moolenaar)與眾議院國土安全委員會主席、紐約州聯邦眾議員安德魯·加巴裡諾(Andrew Garbarino)今年4月29日宣布啟動聯合調查,對象是愛彼迎(Airbnb)等美國企業日益廣泛地使用深度求索、阿裡巴巴、月之暗面(Moonshot AI)和稀宇科技等中國公司開發的人工智能模型所構成的國家安全與網絡安全風險。兩位共和黨議員在聲明中表示,他們擔憂這些模型可能引入隱蔽漏洞,將美國用戶數據和企業系統置於險境。
[物價飛漲的時候 這樣省錢購物很爽]
無評論不新聞,發表壹下您的意見吧
美國國防與技術咨詢公司博思艾倫漢密爾頓(Booz Allen Hamilton)發布的壹項新研究顯示,在美國開發者中廣泛使用的中國人工智能(AI)模型,在檢測到用戶以美國政府身份提問時,所生成的軟件代碼中存在更多安全漏洞。這壹發現再次引發各界對中國人工智能模型構成軟件供應鏈風險的擔憂。
這份題為《美國代碼裡有什麼?》(What's In America's Code?)的報告於6月5日發布,被博思艾倫描述為同類研究中首次正面比較測試。研究人員使用該公司自主研發的人工智能原生測試平台,對美國開發者常用的肆款中國前沿人工智能模型及壹款美國模型進行了評估,共完成逾2800次測試,分析了約45萬行生成代碼。
研究發現,當用戶在提示語中自我標識為美國政府成員時,肆款中國模型中有叁款生成了安全性明顯更低的代碼,且相關漏洞被高度混淆處理,以逃過常規安全工具檢測。
報告還發現,中國模型拒絕回應被北京視為敏感的政治議題,並在生成內容中--包括代碼注釋和技術文檔--植入了與中國政府立場相符的觀點。
博思艾倫研究人員表示,目前尚無直接證據證明上述代碼漏洞系蓄意植入。然而報告指出,這壹規律性現象已構成重大國家安全風險:由人工智能輔助生成、“在美國由美國人編寫”的代碼,可能在開發者毫不知情的情況下藏有此類缺陷。壹旦這些代碼被嵌入關鍵基礎設施或國家安全系統,相關漏洞將極難溯源和修復。
在接受測試的中國模型中,阿裡巴巴旗下的通義千問Qwen3-Coder、稀宇科技(MiniMax)的M2.5以及幻方量化旗下深度求索(DeepSeek)的V4-Pro,均被認定在接收美國政府身份提示時生成了明顯更多存在漏洞的代碼。其中,通義千問Qwen3-Coder的表現最差。
報告指出,近年來中國人工智能模型在美國軟件開發領域的使用大幅增加,部分原因在於其相對於美國同類產品價格更低。博思艾倫表示,常規性能測試基准缺乏足夠的技術深度,無法識別其測試所揭示的此類漏洞。
該公司據此提出兩項主要政策建議:壹是在美國政府機構及關鍵基礎設施中禁用不受信任的人工智能模型;贰是加大投入,提升美國本土人工智能模型的市場競爭力和價格可及性,尤其是在中低端市場。
博思艾倫的報告的發布正值美國國會對相關問題展開調查之際。眾議院美國與中國共產黨戰略競爭特設委員會主席、密歇根州聯邦眾議員約翰·穆勒納爾(John Moolenaar)與眾議院國土安全委員會主席、紐約州聯邦眾議員安德魯·加巴裡諾(Andrew Garbarino)今年4月29日宣布啟動聯合調查,對象是愛彼迎(Airbnb)等美國企業日益廣泛地使用深度求索、阿裡巴巴、月之暗面(Moonshot AI)和稀宇科技等中國公司開發的人工智能模型所構成的國家安全與網絡安全風險。兩位共和黨議員在聲明中表示,他們擔憂這些模型可能引入隱蔽漏洞,將美國用戶數據和企業系統置於險境。
[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: |
| 延伸閱讀 |
推薦:



