壹天燒掉120萬億Token,字節震驚全球
剛剛,火山引擎公布了壹個數字:
豆包大模型日均Token使用量已突破120萬億。
放眼全球,120萬億/日都是壹個是非常極端的Token量。
在Token即生產力的今天,這個數字到底意味著什麼?
120萬億Token是什麼量級?
先來對比幾組公開數據:
豆包(字節):120萬億Token/日(2026年3月);
OpenAI:API平台每分鍾60億Token,折算約8.64萬億/日(僅API,不含ChatGPT訂閱全量);
Google:Gemini處理Token達1300萬億/月,折算下來約43萬億/日(2025年10月);
微軟:2025財年Q3單季度超100萬億Token,單月最高50萬億,粗算約合1.7萬億/日。
盡管各家口徑不同,但量級清晰可見:
全球能把Token日均吞吐做到百萬億級別的,屈指可數。
換算成更直觀的工程指標:120萬億Token/日,相當於每秒並發處理13.9億Token。
這已經不是實驗室的壓力測試,而是真實生產環境的持續負載。
這意味著字節正在經歷超大規模AI平台的運營驗證。
過去外界談大模型,更多比較的是參數、榜單、體驗。
但是當Token消耗量達到120萬億/日這種量級時,大家關注的重心就變成了平台的基礎設施能力,如何把這麼多Token持續、穩定、低成本地跑出來?
這裡面考驗的是推理吞吐、時延控制、任務調度、成本優化、故障隔離、高峰期的穩定性等各種能力。
某種程度上,字節已經把AI推到了“Token工廠”的量級。
誰能持續承接海量Token,誰就更有機會在下壹輪AI競爭裡掌握供給能力、結算能力和平台地位。
誰在燃燒120萬億Token?
還有壹組數據,也很有沖擊力。
豆包大模型日均Token使用量,最近叁個月翻了1倍,兩年時間裡更是暴增1000倍。
這種爆炸式的增長動力從何而來?
火山引擎總裁譚待表示,近期豆包大模型使用量高速增長,核心驅動因素是AI視頻創作的爆發與AI智能體的加速普及。
其中,視頻生成是最容易理解的壹類重負載。
Seedance 2.0在2月發布後迅速走紅,字節也把它作為近期重點能力推向市場。
公開資料顯示,Seedance 2.0生成15秒視頻大約需要30.888萬Token,而生成10秒 1080p視頻需消耗約為35萬Token。
這和普通文本問答完全不是壹個量級:後者壹次可能只消耗幾百到幾千Token,而前者壹次任務就是幾拾萬Token。
目前,壹部AI漫劇作品的Token消耗可達上億。
只要視頻生成需求開始大規模起量,它就足以迅速推高整個平台的Token總量。
智能體帶來的變化更隱蔽,但同樣重要。
普通聊天是壹輪輸入、壹輪輸出,但智能體要經過任務拆解、工具調用、上下文讀取、結果校驗、失敗重試等多個步驟。
壹個Agent任務背後,往往對應的是壹串模型調用,而不是壹次問答。
所以,智能體普及帶來的不是用戶數簡單增加,而是單次任務Token消耗強度的大幅上升。
盡管字節未披露豆包大模型的Token結構拆分,但可以推測的是,其Token結構正在變化。
過去,豆包大模型既有豆包 App、抖音、剪映、今日頭條等字節內部產品場景,也包括企業、開發者等外部商業API調用。
但現在,新增量越來越多地來自更重的場景,高消耗、高工作流的企業級場景,正在快速上升。
未來Token的走向
這也符合行業內正在形成的壹個共識:企業級、重任務的場景將更快地推動Token的增長。
OpenAI在2025年底發布的企業報告提到,已有9000多家組織累計處理超過100億 Token,其中接近200家超過1萬億Token;
[加西網正招聘多名全職sales 待遇優]
這條新聞還沒有人評論喔,等著您的高見呢
豆包大模型日均Token使用量已突破120萬億。
放眼全球,120萬億/日都是壹個是非常極端的Token量。
在Token即生產力的今天,這個數字到底意味著什麼?
120萬億Token是什麼量級?
先來對比幾組公開數據:
豆包(字節):120萬億Token/日(2026年3月);
OpenAI:API平台每分鍾60億Token,折算約8.64萬億/日(僅API,不含ChatGPT訂閱全量);
Google:Gemini處理Token達1300萬億/月,折算下來約43萬億/日(2025年10月);
微軟:2025財年Q3單季度超100萬億Token,單月最高50萬億,粗算約合1.7萬億/日。
盡管各家口徑不同,但量級清晰可見:
全球能把Token日均吞吐做到百萬億級別的,屈指可數。
換算成更直觀的工程指標:120萬億Token/日,相當於每秒並發處理13.9億Token。
這已經不是實驗室的壓力測試,而是真實生產環境的持續負載。
這意味著字節正在經歷超大規模AI平台的運營驗證。
過去外界談大模型,更多比較的是參數、榜單、體驗。
但是當Token消耗量達到120萬億/日這種量級時,大家關注的重心就變成了平台的基礎設施能力,如何把這麼多Token持續、穩定、低成本地跑出來?
這裡面考驗的是推理吞吐、時延控制、任務調度、成本優化、故障隔離、高峰期的穩定性等各種能力。
某種程度上,字節已經把AI推到了“Token工廠”的量級。
誰能持續承接海量Token,誰就更有機會在下壹輪AI競爭裡掌握供給能力、結算能力和平台地位。
誰在燃燒120萬億Token?
還有壹組數據,也很有沖擊力。
豆包大模型日均Token使用量,最近叁個月翻了1倍,兩年時間裡更是暴增1000倍。
這種爆炸式的增長動力從何而來?
火山引擎總裁譚待表示,近期豆包大模型使用量高速增長,核心驅動因素是AI視頻創作的爆發與AI智能體的加速普及。
其中,視頻生成是最容易理解的壹類重負載。
Seedance 2.0在2月發布後迅速走紅,字節也把它作為近期重點能力推向市場。
公開資料顯示,Seedance 2.0生成15秒視頻大約需要30.888萬Token,而生成10秒 1080p視頻需消耗約為35萬Token。
這和普通文本問答完全不是壹個量級:後者壹次可能只消耗幾百到幾千Token,而前者壹次任務就是幾拾萬Token。
目前,壹部AI漫劇作品的Token消耗可達上億。
只要視頻生成需求開始大規模起量,它就足以迅速推高整個平台的Token總量。
智能體帶來的變化更隱蔽,但同樣重要。
普通聊天是壹輪輸入、壹輪輸出,但智能體要經過任務拆解、工具調用、上下文讀取、結果校驗、失敗重試等多個步驟。
壹個Agent任務背後,往往對應的是壹串模型調用,而不是壹次問答。
所以,智能體普及帶來的不是用戶數簡單增加,而是單次任務Token消耗強度的大幅上升。
盡管字節未披露豆包大模型的Token結構拆分,但可以推測的是,其Token結構正在變化。
過去,豆包大模型既有豆包 App、抖音、剪映、今日頭條等字節內部產品場景,也包括企業、開發者等外部商業API調用。
但現在,新增量越來越多地來自更重的場景,高消耗、高工作流的企業級場景,正在快速上升。
未來Token的走向
這也符合行業內正在形成的壹個共識:企業級、重任務的場景將更快地推動Token的增長。
OpenAI在2025年底發布的企業報告提到,已有9000多家組織累計處理超過100億 Token,其中接近200家超過1萬億Token;
[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
Token=詞元 Prompt=文令…這些AI術語的中文名定了 |
直擊GTC,老黃就指著你燒token了 |
Token太貴了,還是用人吧,人耐造,還便宜 |
10萬token GPT4最強對手1分秒殺 |
推薦:
壹天燒掉120萬億Token,字節震驚全球