Anthropic深夜發布Claude Fable 5 屠榜所有測試

Anthtropic剛剛推出了壹款 Mythos 級模型Claude Fable 5,面向所有普通用戶開放,今天全面上線

與此同時,針對少數特定合作方,他們還推出了 Claude Mythos 5,它與 Fable 5 采用相同的底層模型,是 Claude Mythos Preview 的升級版,訪問權限很快會擴大
Fable(寓言)源自拉丁語 fabula,意為"被講述之物",與希臘語 mythos 同源。安全護欄是區分這兩個模型的核心差異,也是它們擁有不同名稱的原因所在,AndrejKarpathy說Fable5是壹次重大飛躍,傑文斯悖論開始顯現,軟件需求在大幅增長。你可以要求任何東西:解釋器、可視化工具、定制應用、把測試套件擴充10倍、自動優化代碼、運行大型研究項目並用自定義HTML呈現結果
Fable 5 和 Mythos 5 的定價分別為每百萬個輸入tokens 10 美元和每百萬個輸出tokens 50 美元,不到 Claude Mythos Preview 價格的壹半
到底有多強?
Fable 5 在幾乎所有測試過的 AI 能力基准上都達到了最先進水平,涵蓋軟件工程、知識工作、視覺、科學研究等眾多領域。
並且任務越長、越復雜,Fable 5 相對其他模型的領先幅度就越大。

編程:把兩個月的工作壓縮進壹天
測試期間,Stripe 反饋說,Fable 5 把原本需要數月的工程工作壓縮到了幾天之內。
具體來說:在壹個有 5000 萬行 Ruby 代碼的大型代碼庫裡,Fable 5 用壹天時間完成了壹次全庫遷移,而這項工作如果靠人工完成,整個團隊需要兩個月以上。
在 Cognition 的 FrontierCode 評測上,Fable 5 也拿到了前沿模型中的最高分。這個評測不只看能不能完成編程任務,還要求符合高質量生產代碼庫的標准,而且 Fable 5 在中等算力消耗下就做到了,token 效率高於以往的 Claude 模型。
[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
推薦:



