網民熬夜玩兒瘋,Claude Opus 4.7來了
而對於確實有合法網絡安全需求的專業人士,Anthropic推出了Cyber Verification Program。
安全專業人員如需將Opus 4.7用於漏洞研究、滲透測試、紅隊演練等合法目的,可以通過正式渠道申請。
官網還在上線播客的最後寫到,如果開發者們想從Opus 4.6遷移到4.7版本,有壹些事項需要格外注意。
首先是tokenizer的更新。
Opus 4.7使用了新的分詞器,雖然改善了文本處理效率,但相同輸入可能映射到更多tokens,大約是1.0到1.35倍之間。
這意味著同樣的提示詞可能會消耗更多token,需要在成本預算中留出余量。
其次是在更高努力級別下會產生更多輸出tokens。
Opus 4.7在high和xhigh級別下的思考深度明顯增加,特別是在Agent場景的多輪對話後期。
這種“多思考、更可靠”的行為模式提升了輸出質量,但也意味著token消耗會隨會話長度增長。
與Opus 4.6同價,有這些注意事項你需要知道
目前,Opus 4.7已實現全平台開放。
除Claude官方途徑外,新模型不僅登陸 Claude Pro/Max/Team/Enterprise 全系產品、官方API,還同步上線微軟Foundry、谷歌Cloud Vertex AI、亞馬遜Bedrock叁大雲平台。
其定價與Opus 4.6保持壹致:輸入5美元每百萬tokens,輸出25美元每百萬tokens。
雖然如前所述,Opus 4.7涉及提示詞的重構需求和token使用策略的調整,但Anthropic在自己的內部測試中給出了積極信號。
在壹個內部Agent編碼評估中,所有effort level下的token使用效率相比Opus 4.6都有改善。
換句話說,雖然單次調用的token數可能增加,但完成任務所需的總token往往更少,因為模型犯錯的次數減少了。
大概就像你雇了個時薪更高的資深工程師,但他完成任務的速度更快、返工更少,最終總成本可能更低。
另外,Opus 4.7在後續輪次中會更加謹慎,特別是在Agent場景中。
這意味著更可靠的輸出,但也意味著更多的token消耗。
開發者可以通過調整effort參數、設置任務預算或優化提示詞來平衡性能與成本。
Anthropic建議,在測試Opus 4.7的編碼和Agent用例時,從high或xhigh努力級別開始,根據實際需求逐步調整。
Anyway~
總的來說,實際使用成本會因使用方式的不同而變化,但大多數情況下,能力提升帶來的效率增益會抵消token消耗的增加。
對於依賴Claude進行復雜開發工作的團隊來說,這很可能是壹筆劃算的交易。
[加西網正招聘多名全職sales 待遇優]
無評論不新聞,發表壹下您的意見吧
安全專業人員如需將Opus 4.7用於漏洞研究、滲透測試、紅隊演練等合法目的,可以通過正式渠道申請。
官網還在上線播客的最後寫到,如果開發者們想從Opus 4.6遷移到4.7版本,有壹些事項需要格外注意。
首先是tokenizer的更新。
Opus 4.7使用了新的分詞器,雖然改善了文本處理效率,但相同輸入可能映射到更多tokens,大約是1.0到1.35倍之間。
這意味著同樣的提示詞可能會消耗更多token,需要在成本預算中留出余量。
其次是在更高努力級別下會產生更多輸出tokens。
Opus 4.7在high和xhigh級別下的思考深度明顯增加,特別是在Agent場景的多輪對話後期。
這種“多思考、更可靠”的行為模式提升了輸出質量,但也意味著token消耗會隨會話長度增長。
與Opus 4.6同價,有這些注意事項你需要知道
目前,Opus 4.7已實現全平台開放。
除Claude官方途徑外,新模型不僅登陸 Claude Pro/Max/Team/Enterprise 全系產品、官方API,還同步上線微軟Foundry、谷歌Cloud Vertex AI、亞馬遜Bedrock叁大雲平台。
其定價與Opus 4.6保持壹致:輸入5美元每百萬tokens,輸出25美元每百萬tokens。
雖然如前所述,Opus 4.7涉及提示詞的重構需求和token使用策略的調整,但Anthropic在自己的內部測試中給出了積極信號。
在壹個內部Agent編碼評估中,所有effort level下的token使用效率相比Opus 4.6都有改善。
換句話說,雖然單次調用的token數可能增加,但完成任務所需的總token往往更少,因為模型犯錯的次數減少了。
大概就像你雇了個時薪更高的資深工程師,但他完成任務的速度更快、返工更少,最終總成本可能更低。
另外,Opus 4.7在後續輪次中會更加謹慎,特別是在Agent場景中。
這意味著更可靠的輸出,但也意味著更多的token消耗。
開發者可以通過調整effort參數、設置任務預算或優化提示詞來平衡性能與成本。
Anthropic建議,在測試Opus 4.7的編碼和Agent用例時,從high或xhigh努力級別開始,根據實際需求逐步調整。
Anyway~
總的來說,實際使用成本會因使用方式的不同而變化,但大多數情況下,能力提升帶來的效率增益會抵消token消耗的增加。
對於依賴Claude進行復雜開發工作的團隊來說,這很可能是壹筆劃算的交易。
[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
推薦:
網民熬夜玩兒瘋,Claude Opus 4.7來了