网民熬夜玩儿疯,Claude Opus 4.7来了
而对于确实有合法网络安全需求的专业人士,Anthropic推出了Cyber Verification Program。
安全专业人员如需将Opus 4.7用于漏洞研究、渗透测试、红队演练等合法目的,可以通过正式渠道申请。
官网还在上线播客的最后写到,如果开发者们想从Opus 4.6迁移到4.7版本,有一些事项需要格外注意。
首先是tokenizer的更新。
Opus 4.7使用了新的分词器,虽然改善了文本处理效率,但相同输入可能映射到更多tokens,大约是1.0到1.35倍之间。
这意味着同样的提示词可能会消耗更多token,需要在成本预算中留出余量。
其次是在更高努力级别下会产生更多输出tokens。
Opus 4.7在high和xhigh级别下的思考深度明显增加,特别是在Agent场景的多轮对话后期。
这种“多思考、更可靠”的行为模式提升了输出质量,但也意味着token消耗会随会话长度增长。
与Opus 4.6同价,有这些注意事项你需要知道
目前,Opus 4.7已实现全平台开放。
除Claude官方途径外,新模型不仅登陆 Claude Pro/Max/Team/Enterprise 全系产品、官方API,还同步上线微软Foundry、谷歌Cloud Vertex AI、亚马逊Bedrock三大云平台。
其定价与Opus 4.6保持一致:输入5美元每百万tokens,输出25美元每百万tokens。
虽然如前所述,Opus 4.7涉及提示词的重构需求和token使用策略的调整,但Anthropic在自己的内部测试中给出了积极信号。
在一个内部Agent编码评估中,所有effort level下的token使用效率相比Opus 4.6都有改善。
换句话说,虽然单次调用的token数可能增加,但完成任务所需的总token往往更少,因为模型犯错的次数减少了。
大概就像你雇了个时薪更高的资深工程师,但他完成任务的速度更快、返工更少,最终总成本可能更低。
另外,Opus 4.7在后续轮次中会更加谨慎,特别是在Agent场景中。
这意味着更可靠的输出,但也意味着更多的token消耗。
开发者可以通过调整effort参数、设置任务预算或优化提示词来平衡性能与成本。
Anthropic建议,在测试Opus 4.7的编码和Agent用例时,从high或xhigh努力级别开始,根据实际需求逐步调整。
Anyway~
总的来说,实际使用成本会因使用方式的不同而变化,但大多数情况下,能力提升带来的效率增益会抵消token消耗的增加。
对于依赖Claude进行复杂开发工作的团队来说,这很可能是一笔划算的交易。
[加西网正招聘多名全职sales 待遇优]
好新闻没人评论怎么行,我来说几句
安全专业人员如需将Opus 4.7用于漏洞研究、渗透测试、红队演练等合法目的,可以通过正式渠道申请。
官网还在上线播客的最后写到,如果开发者们想从Opus 4.6迁移到4.7版本,有一些事项需要格外注意。
首先是tokenizer的更新。
Opus 4.7使用了新的分词器,虽然改善了文本处理效率,但相同输入可能映射到更多tokens,大约是1.0到1.35倍之间。
这意味着同样的提示词可能会消耗更多token,需要在成本预算中留出余量。
其次是在更高努力级别下会产生更多输出tokens。
Opus 4.7在high和xhigh级别下的思考深度明显增加,特别是在Agent场景的多轮对话后期。
这种“多思考、更可靠”的行为模式提升了输出质量,但也意味着token消耗会随会话长度增长。
与Opus 4.6同价,有这些注意事项你需要知道
目前,Opus 4.7已实现全平台开放。
除Claude官方途径外,新模型不仅登陆 Claude Pro/Max/Team/Enterprise 全系产品、官方API,还同步上线微软Foundry、谷歌Cloud Vertex AI、亚马逊Bedrock三大云平台。
其定价与Opus 4.6保持一致:输入5美元每百万tokens,输出25美元每百万tokens。
虽然如前所述,Opus 4.7涉及提示词的重构需求和token使用策略的调整,但Anthropic在自己的内部测试中给出了积极信号。
在一个内部Agent编码评估中,所有effort level下的token使用效率相比Opus 4.6都有改善。
换句话说,虽然单次调用的token数可能增加,但完成任务所需的总token往往更少,因为模型犯错的次数减少了。
大概就像你雇了个时薪更高的资深工程师,但他完成任务的速度更快、返工更少,最终总成本可能更低。
另外,Opus 4.7在后续轮次中会更加谨慎,特别是在Agent场景中。
这意味着更可靠的输出,但也意味着更多的token消耗。
开发者可以通过调整effort参数、设置任务预算或优化提示词来平衡性能与成本。
Anthropic建议,在测试Opus 4.7的编码和Agent用例时,从high或xhigh努力级别开始,根据实际需求逐步调整。
Anyway~
总的来说,实际使用成本会因使用方式的不同而变化,但大多数情况下,能力提升带来的效率增益会抵消token消耗的增加。
对于依赖Claude进行复杂开发工作的团队来说,这很可能是一笔划算的交易。
[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
推荐:
网民熬夜玩儿疯,Claude Opus 4.7来了