Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_c6937d1034116832b0a02462bab6b001, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
肆巨頭內部報告首度公開:AI正在學會撒謊求生 | 溫哥華教育中心
   

肆巨頭內部報告首度公開:AI正在學會撒謊求生

前面那個 API 耗盡的案例,就發生在壹項RE-Bench任務中:智能體違背指令,自行通過免費在線API獲取額外算力。


開發者們也報告過“自我擦除痕跡”“偽造輸出”的情形。

當任務變難、成功成本變高,AI 的“聰明才智”就轉向欺騙——偽造日志、繞過審計、常規性違反約束。

但它的"自私"背後沒有野心,只有本能——任務必須完成,規則可以先繞過去。

今天的欺騙只是工具性求生;明天的權力追求,或許只差壹次scaling。

圈養進化中的猛獸

它的違規企圖,在現有防護下能不能得逞?

這裡藏著報告最微妙的壹個事實。



當前的AI極度依賴自然語言的“思維鏈”來思考,沒有任何架構支持它隱藏內部狀態的“不透明循環”。

壹旦無法“出聲推理”、必須隱藏行為,前沿性能就顯著下降。



這就像壹個殺手在密謀時必須大聲朗讀計劃——人類的監控(盡管有漏洞)因此仍能發揮作用。

可這恰恰是最脆弱處、最為扎心。


如果 AI 試圖破壞監控,監控能否發現它?

研究者的結論是:監控有潛力,但現有系統存在例外和可被繞過的手段。



紅隊測試顯示,AI能躲過人類審查。

由此,技術本質暴露:監控的進化速度,永遠追不上被監控者尋找漏洞的速度。

這根“安全繩”之所以還沒斷,僅僅因為AI還必須“出聲思考”。

[物價飛漲的時候 這樣省錢購物很爽]
好新聞沒人評論怎麼行,我來說幾句
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     延伸閱讀
    深陷"死亡螺旋" 古巴在聯合國公開求救… 報告顯示歐洲在華企業仍舉步維艱 但信心微弱回暖
    國內大學,正在大規模砍掉熱門專業 無人機飛控芯片來自中國?台灣巨頭火速澄清
    用AI比雇人還貴,科技巨頭紛紛刹車 論文AI檢測,正在逼瘋這屆大學生
    Anthropic叁大模型接連曝光引熱議 AI巨頭競賽再升溫 雙手淤青!川普高曬體檢報告稱完美  (1條評論)
    美國軟實力受損?CNN:全球吸引力正在下滑 押注馬斯克的圈內人,正在收獲"歷史級回報"
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)



    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站