[留學生] 中留學生論文登Nature 大模型對人類可靠性降低

作者介紹


論文壹作 Lexin Zhou(周樂鑫),目前剛從劍橋大學CS碩士畢業(24歲),研究興趣為大語言模型評測。

在此之前,他在瓦倫西亞理工大學獲得了數據科學學士學位,指導老師是Jose Hernandez-Orallo教授。



個人主頁顯示,他曾有多段工作實習經歷。在OpenAI和Meta都參與了紅隊測試。 (Red Teaming Consultancy )



關於這篇論文,他重點談到:

通用人工智能的設計和開發需要進行 根本性轉變,特別是在高風險領域,因為可預測的錯誤分布至關重要。在此實現之前, 依賴人類監督是壹種危險。

評估模型時,考慮人類認為的難度和評估模型的回避行為,可以更全面地描述模型的能力和風險,而不僅僅關注在困難任務上的表現。

通用人工智能的設計和開發需要進行 根本性轉變,特別是在高風險領域,因為可預測的錯誤分布至關重要。在此實現之前, 依賴人類監督是壹種危險。


評估模型時,考慮人類認為的難度和評估模型的回避行為,可以更全面地描述模型的能力和風險,而不僅僅關注在困難任務上的表現。



論文也具體提到了導致這些不可靠性的壹些可能原因,以及解決方案:

在Scaling-up中,近幾年的benchmarks越來越偏向於加入更多困難的例子,或者給予所謂“權威”來源更多權重,研究員也因此更傾向於優化模型在困難任務上的表現,導致在難度壹致性上慢性惡化。

在shaping-up中(如RLHF),被雇傭的人傾向於懲罰那些規避任務的答案,導致模型更容易在面對自己無法解決的難題時“胡說八道”。

[物價飛漲的時候 這樣省錢購物很爽]
無評論不新聞,發表壹下您的意見吧
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     延伸閱讀 更多...
    中國女留學生壹夜情後 竟訛上警察 誣告警性侵,中國女留學生被判6年:關鍵錄音曝
    中國女留學生誣告英警性侵:性愛錄音揭其主動 忍不了"天價賬單" 留學生紛紛回國看病?
    創紀錄!川普政府壹年撤銷10萬簽證 含8000留學生 成立公司還為朝鮮購買武器!中國留學生面臨重型
    中國女博士工簽被拒:失去身份!大批留學生踩雷 中國留學生在加拿大被路人塞$100
    加州大規模吊銷Real ID 許多留學生已收到通知 事關留學生!加拿大2026年將推出叁項重大變化
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)



    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站