120萬億Token!中國AI正在"卷"死美國

2026-04-13 | 來源: 格隆匯 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

壹次企業級任務，動輒幾拾萬甚至上百萬Token。

中信證券測算，智能體執行任務時整體Token消耗可能提升拾倍以上，對應的算力需求得漲百倍以上。這種“推理密度”的增加，讓單次任務的Token消耗呈指數級上升。

在OpenRouter平台上，超過70%的Token消耗來自網絡大廠、中大型企業、專業程序員的生產環境。在100K到1MToken這個區間（智能體工作流最典型的消耗區間），中國模型的調用量遙遙領先。

應用爆發→Token增長→模型優化→更多應用。這個正向商業落地循環，真的已經轉起來了。

02

很多人問：中國大模型商業化能如此迅猛，憑什麼？

答案很簡單：成本，低到令人發指的成本！大模型運營成本裡，60%-80%是電費。中國西部（甘肅、內蒙古、貴州）綠電價格只要0.13-0.3元/度。在美國呢？0.8-1.2元/度。

光電力壹項，中國就比美國便宜4-5倍。

如果假設壹個大型推理集群年用電量為100GWh，僅電力壹項，中國的年成本約1150萬美元，美國約1540萬美元——差出近400萬美元。

再加上MoE架構、極致量化、KV緩存……推理效率再比美國高3-10倍,雙重降維打擊下，中國模型的推理成本被壓縮至美國模型的1/6至1/10。

最終體現在API定價上（美元/百萬Token）：

-MiniMaxM2.5：輸入0.3、輸出1.1；

-智譜GLM-5：輸入0.3、輸出2.55；

-通義Qwen3.5：輸入0.11、輸出0.44；

-對比ClaudeOpus4.6：輸入5、輸出25；

這意味著，中國模型成本只有美國巨頭的1/10到1/20，甚至更低。

形同天塹壹樣的差距。

而性能呢？在文本生成、代碼、翻譯、日常推理等90%的高頻場景，中國頭部模型已經達到GPT-5、Gemini3的95%以上。

對絕大多數用戶來說，“夠用、好用、便宜”就是全部。中國模型完美踩中了這個點。

於是，全球開發者用腳投票：OpenRouter平台數據顯示，47.17%的用戶是美國本土開發者，中國開發者僅占6.01%，但中國大模型在該平台的周Token調用量占比已達61%，連續叁周超越美國。

更震撼的是調用量排名：在全球前九大模型中，中國占據伍席，小米MiMo-V2-Pro、階躍星辰Step3.5Flash、MiniMaxM2.5、DeepSeekV3.2包攬前肆，智譜GLM-5Turbo位列第六。

這樣的大模型，超級便宜又足夠能打，海外市場想要“脫鉤”？不存在的。“成本剛需”已經碾碎了所有壁壘。

不過，另壹方面，中國Token的超級紅利，卻是OpenAI、Google、xAI的壓力挑戰。

來看幾個硬核數據：

OpenAI：ChatGPT在生成式AI網頁流量中的份額從2025年1月的86.7%暴跌至2026年1月的64.5%，壹年跌了22.2個百分點。2月全球月活用戶約5.35億，按月下降6.5%。運營虧損預計將達到140億美元，幾乎是前壹年的叁倍。更諷刺的是，80%的用戶全年交互不足1000次——打開率還不如外賣軟件。

Google：盡管Gemini的份額從5.7%漲到了21.5%，但AIStudio開發者流失25%，被迫推出低價版GeminiFlash（3美元/百萬Token），但成本仍是中國模型的3倍。

[物價飛漲的時候這樣省錢購物很爽] 還沒人說話啊，我想來說幾句

分享:

上壹頁 123 下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

專家專欄

工具

當前會員

120萬億Token!中國AI正在"卷"死美國

意見