"所有人都在談石油,但我覺得世界短缺的是Token

OpenAI悄悄放棄了壹款視頻生成應用Sora。這款產品上線僅伍天,下載量就突破百萬。公司CFO罕見地公開坦承:“我們在做壹些非常艱難的交易,因為沒有足夠算力。”
幾乎同壹時間,以代碼能力爆紅的Claude開始頻繁宕機。過去叁個月,它的正常運行時間只有98.95%,而互聯網服務通常承諾的是99.99%。大量企業用戶被迫遷移,壹位CEO說:“Anthropic壹直在宕機。”
價格也在瘋漲。在雲端租用英偉達最新款Blackwell芯片,壹小時的價格從兩個月前的2.75美元跳到4.08美元,漲幅接近壹半。就連2022年發布的“老將”H100,半年內的租賃價也漲了將近40%。
雲基礎設施公司Vultr的CEO J.J. Kardwell說:“我經營這家公司伍年多,從來沒遇到過這麼嚴重的容量短缺。”
這是壹場產業級別的系統性危機。AI的算力泡沫被刺破了,而刺破它的不是需求下滑,恰恰相反,是需求大到供給根本追不上。
Token:壹種比石油更緊缺的新資源
認識壹下新單位:Token,中文叫詞元。
你可以把它想象成AI的“呼吸”。每壹次你向AI提問,讓它寫代碼、畫圖、查資料,背後都在消耗Token。任務越復雜,呼吸越急促,消耗就越大。如果你只是問“今天天氣怎麼樣”,AI可能喘幾口就行。但如果你讓它幫你整理壹周的工作日志、寫壹份競品分析報告,它得深呼吸幾百上千次。
過去幾個月,全球Token消耗量出現了壹種讓人眩暈的增長曲線。
OpenAI面向企業客戶的API平台,Token調用量從2025年10月的每分鍾60億,飆到了2026年3月底的每分鍾150億。伍個月,翻了兩倍半。
摩根士丹利的統計更嚇人。全球每周Token使用量,2026年1月還是6.4萬億,到3月已經沖到22.7萬億。叁個月,叁倍多。
這場海嘯的推手是誰?答案是智能體AI。
以前的AI像個問答機器,你問它答,壹錘子買賣。但2026年初,以OpenClaw為代表的智能體工具登場了。AI從“回答問題”升級到了“執行任務”:它可以自己打開文件夾,閱讀文檔,調用軟件,填寫表格,發送郵件。壹個完整任務往往需要AI反復琢磨,調用柒八種工具,在多個步驟之間來回切換。單次任務的算力消耗,比簡單問答高出數倍甚至數拾倍。
工程師兼投資人Ben Pouladian總結得很精准:“所有人都在談石油,但我覺得世界真正短缺的是Token。AI早就不是站在冰箱前面問菜譜的那個聊天機器人了。它在編排任務,它在變聰明。”
需求端烈火烹油,供給端呢?
叁道牆:制造,電力,水泥
如果你覺得“算力不夠”只是芯片下單太少,那就把事情想簡單了。
第壹道牆,芯片制造。
英偉達的GPU是AI時代的發動機。但發動機不會從天上掉下來。它得在台積電的晶圓廠裡,靠荷蘭ASML的天價EUV光刻機,壹層壹層刻出納米級的電路。
EUV光刻機壹年只產幾拾台,交付排隊時間超過拾八個月。高端GPU離不開的HBM高帶寬內存,產能同樣有限,擴張節奏遠遠跟不上需求的腳步。摩根士丹利的預測很直接:當前AI算力需求的增速,是英偉達供給增速的叁倍。
換句話說,就算英偉達把生產線拉到滿,供需之間的口子還在繼續撕大。
第贰道牆,電力。
AI的盡頭是電,這句話壹點不誇張。
壹台裝滿GPU的服務器機櫃,跑起來的功耗抵得上拾幾台家用空調同時運轉。壹個大型數據中心,每天吞掉的電夠壹座小型城市用。美國電力研究院算過壹筆賬:2025到2028年間,美國數據中心面臨的電力缺口大約是55吉瓦。55吉瓦什麼概念?將近贰拾座大型核電站的發電量。
正因如此,Meta這樣的科技巨頭已經開始跨界投核電了。雲服務商們也承認,“2026年的可用電力已經全部被預訂光了”。
[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 |
推薦:



