中留學生論文登Nature 大模型對人類可靠性降低

新聞

留學生

[留學生] 中留學生論文登Nature 大模型對人類可靠性降低

2024-10-04 | 來源: 量子位 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

作者介紹

論文壹作 Lexin Zhou（周樂鑫），目前剛從劍橋大學CS碩士畢業（24歲），研究興趣為大語言模型評測。

在此之前，他在瓦倫西亞理工大學獲得了數據科學學士學位，指導老師是Jose Hernandez-Orallo教授。

個人主頁顯示，他曾有多段工作實習經歷。在OpenAI和Meta都參與了紅隊測試。（Red Teaming Consultancy ）

關於這篇論文，他重點談到：

通用人工智能的設計和開發需要進行根本性轉變，特別是在高風險領域，因為可預測的錯誤分布至關重要。在此實現之前，依賴人類監督是壹種危險。

評估模型時，考慮人類認為的難度和評估模型的回避行為，可以更全面地描述模型的能力和風險，而不僅僅關注在困難任務上的表現。

通用人工智能的設計和開發需要進行根本性轉變，特別是在高風險領域，因為可預測的錯誤分布至關重要。在此實現之前，依賴人類監督是壹種危險。

評估模型時，考慮人類認為的難度和評估模型的回避行為，可以更全面地描述模型的能力和風險，而不僅僅關注在困難任務上的表現。

論文也具體提到了導致這些不可靠性的壹些可能原因，以及解決方案：

在Scaling-up中，近幾年的benchmarks越來越偏向於加入更多困難的例子，或者給予所謂“權威”來源更多權重，研究員也因此更傾向於優化模型在困難任務上的表現，導致在難度壹致性上慢性惡化。

在shaping-up中（如RLHF），被雇傭的人傾向於懲罰那些規避任務的答案，導致模型更容易在面對自己無法解決的難題時“胡說八道”。

[物價飛漲的時候這樣省錢購物很爽] 無評論不新聞，發表壹下您的意見吧

分享:

上壹頁 1 2 3 456 下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

延伸閱讀

更多...

中國女留學生壹夜情後竟訛上警察	誣告警性侵,中國女留學生被判6年:關鍵錄音曝
中國女留學生誣告英警性侵:性愛錄音揭其主動	忍不了"天價賬單" 留學生紛紛回國看病?
創紀錄!川普政府壹年撤銷10萬簽證含8000留學生	成立公司還為朝鮮購買武器!中國留學生面臨重型
中國女博士工簽被拒:失去身份!大批留學生踩雷	中國留學生在加拿大被路人塞$100
加州大規模吊銷Real ID 許多留學生已收到通知	事關留學生!加拿大2026年將推出叁項重大變化

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

專家專欄

工具

當前會員

[留學生] 中留學生論文登Nature 大模型對人類可靠性降低

意見