120万亿Token!中国AI正在"卷"死美国

一次企业级任务,动辄几十万甚至上百万Token。


中信证券测算,智能体执行任务时整体Token消耗可能提升十倍以上,对应的算力需求得涨百倍以上。这种“推理密度”的增加,让单次任务的Token消耗呈指数级上升。

在OpenRouter平台上,超过70%的Token消耗来自网络大厂、中大型企业、专业程序员的生产环境。在100K到1MToken这个区间(智能体工作流最典型的消耗区间),中国模型的调用量遥遥领先。

应用爆发→Token增长→模型优化→更多应用。这个正向商业落地循环,真的已经转起来了。

02

很多人问:中国大模型商业化能如此迅猛,凭什么?

答案很简单:成本,低到令人发指的成本!大模型运营成本里,60%-80%是电费。中国西部(甘肃、内蒙古、贵州)绿电价格只要0.13-0.3元/度。在美国呢?0.8-1.2元/度。

光电力一项,中国就比美国便宜4-5倍。

如果假设一个大型推理集群年用电量为100GWh,仅电力一项,中国的年成本约1150万美元,美国约1540万美元——差出近400万美元。

再加上MoE架构、极致量化、KV缓存……推理效率再比美国高3-10倍,双重降维打击下,中国模型的推理成本被压缩至美国模型的1/6至1/10。

最终体现在API定价上(美元/百万Token):

-MiniMaxM2.5:输入0.3、输出1.1;

-智谱GLM-5:输入0.3、输出2.55;

-通义Qwen3.5:输入0.11、输出0.44;

-对比ClaudeOpus4.6:输入5、输出25;

这意味着,中国模型成本只有美国巨头的1/10到1/20,甚至更低。



形同天堑一样的差距。


而性能呢?在文本生成、代码、翻译、日常推理等90%的高频场景,中国头部模型已经达到GPT-5、Gemini3的95%以上。

对绝大多数用户来说,“够用、好用、便宜”就是全部。中国模型完美踩中了这个点。

于是,全球开发者用脚投票:OpenRouter平台数据显示,47.17%的用户是美国本土开发者,中国开发者仅占6.01%,但中国大模型在该平台的周Token调用量占比已达61%,连续三周超越美国。

更震撼的是调用量排名:在全球前九大模型中,中国占据五席,小米MiMo-V2-Pro、阶跃星辰Step3.5Flash、MiniMaxM2.5、DeepSeekV3.2包揽前四,智谱GLM-5Turbo位列第六。

这样的大模型,超级便宜又足够能打,海外市场想要“脱钩”?不存在的。“成本刚需”已经碾碎了所有壁垒。

不过,另一方面,中国Token的超级红利,却是OpenAI、Google、xAI的压力挑战。

来看几个硬核数据:

OpenAI:ChatGPT在生成式AI网页流量中的份额从2025年1月的86.7%暴跌至2026年1月的64.5%,一年跌了22.2个百分点。2月全球月活用户约5.35亿,按月下降6.5%。运营亏损预计将达到140亿美元,几乎是前一年的三倍。更讽刺的是,80%的用户全年交互不足1000次——打开率还不如外卖软件。

Google:尽管Gemini的份额从5.7%涨到了21.5%,但AIStudio开发者流失25%,被迫推出低价版GeminiFlash(3美元/百万Token),但成本仍是中国模型的3倍。

[加西网正招聘多名全职sales 待遇优]
这条新闻还没有人评论喔,等着您的高见呢
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读
    大厂只需要Token,不再需要活人(图 一天烧掉120万亿Token,字节震惊全球
    Token=词元 Prompt=文令…这些AI术语的中文名定了 直击GTC,老黄就指着你烧token了
    Token太贵了,还是用人吧,人耐造,还便宜 10万token GPT4最强对手1分秒杀
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站