[留學生] 中留學生論文登Nature 大模型對人類可靠性降低

00後國人壹作登上Nature,這篇大模型論文引起熱議。


簡單來說,論文發現:更大且更遵循指令的大模型也變得更不可靠了,某些情況下 GPT-4在回答可靠性上還不如GPT-3。

與早期模型相比,有更多算力和人類反饋加持的最新模型,在回答可靠性上實際愈加惡化了。

結論壹出,立即引來20多萬網友圍觀。

在Reddit論壇也引發圍觀議論。

這讓人不禁想起,壹大堆專家/博士級別的模型還不會“9.9和9.11”哪個大這樣的簡單問題。

關於這個現象,論文提到這也反映出, 模型的表現與人類對難度的預期不符。

換句話說,“LLMs在用戶預料不到的地方既成功又(更危險地)失敗”。

Ilya Sutskever2022年曾預測:

也許隨著時間的推移,這種差異會減少。






然而這篇論文發現情況並非如此。不止GPT,LLaMA和BLOOM系列,甚至OpenAI新的 o1模型和Claude-3.5-Sonnet也在可靠性方面令人擔憂。

更重要的是,論文還發現依靠人類監督來糾正錯誤的做法也不管用。



有網友認為,雖然較大的模型可能會帶來可靠性問題,但它們也提供了前所未有的功能。

我們需要專注於開發穩健的評估方法並提高透明度。



[加西網正招聘多名全職sales 待遇優]
好新聞沒人評論怎麼行,我來說幾句
上壹頁123456下壹頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     延伸閱讀 更多...
    中國女留學生壹夜情後 竟訛上警察 誣告警性侵,中國女留學生被判6年:關鍵錄音曝
    中國女留學生誣告英警性侵:性愛錄音揭其主動 忍不了"天價賬單" 留學生紛紛回國看病?
    創紀錄!川普政府壹年撤銷10萬簽證 含8000留學生 成立公司還為朝鮮購買武器!中國留學生面臨重型
    中國女博士工簽被拒:失去身份!大批留學生踩雷 中國留學生在加拿大被路人塞$100
    加州大規模吊銷Real ID 許多留學生已收到通知 事關留學生!加拿大2026年將推出叁項重大變化
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)



    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站