高端AI算力涨价凶猛,灰色交易暗流涌动
当下,国产芯片厂商日渐崛起,但国内市场对海外高端AI芯片的渴求依然强烈。尤其当今年智能体带动Token(词元)消耗量井喷,算力过载、服务宕机的问题愈发凸显。面对“算力荒”,部分模型厂商和云厂商一方面上调产品价格,另一方面则想法设法补充“Token工厂”所需的算力供给。
供需错配加剧了高端算力资源的紧张局面,也催生了新的商机,一批居间交易从业者进入到海外算力供应领域。他们在社交平台、微信群等渠道频繁发布货源信息,寻求有意采购者,再到深圳等地看货。由于货源的稀缺性,高端AI服务器的价格在过去数月内涨势迅猛。多位业内人士告诉南都记者,一台8卡的英伟达B300服务器,报价从3月份前的不到400万元,飙升至当前约700万元。
交易风险随之而来。在深圳从事服务器租赁的谢诚(化名)对此颇有感触:“自从这个行业爆火之后,鱼龙混杂,骗子太多了,主要是热门的B300这类。”骗取定金而无法交货是业内人士眼中的常见套路。一家有AI算力资源采购需求的Token服务商人士也表达了类似担忧。其公司遇到过,签订的期货合约原本约定服务器供应商两个月内交货,但结果供应商根本找不到货,“现在必须要现货,手上有货的才签。”
求卡、涨价
“算力荒”造就卖方市场
AI算力供不应求,一些大模型厂商和云厂商甚至不得不公开“求卡”。
今年2月,月之暗面官方微博账号发帖称:“是真的缺卡。已扩容几次了,还是缺。”在评论区,该账号进一步透露,虽然在测试华为昇腾的芯片,公司仍急需一款海外厂商的GPU产品。
月之暗面公开“求卡”之际,“龙虾”等智能体尚未在中国掀起全民热潮。随着智能体在春节后“出圈”,以及AI编程、视频生成应用等AI产品普及,Token消耗量急遽攀升。国家数据局的数据显示,到今年3月,我国日均Token的调用量已经超过了140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月内又增长超40%。
Token消耗激增导致算力负载持续承压,一系列连锁反应接踵而来:DeepSeek
服务频繁中断,智谱因算力紧张启动限时退款,阿里云、腾讯云等云厂商集体上调模型、算力和存储服务价格。
这背后,是算力需求快速抬升而供给难以及时跟上的现实。半导体产能受限已成为产业瓶颈,而中国大陆市场还受到芯片出口管制的叠加影响。台积电董事长兼首席执行官魏哲家在今年1月的业绩会上坦言:“目前产能非常紧张,我们预计2028年、2029年产能才会显着提升,并希望届时能缩小供需缺口。”阿里巴巴CEO吴泳铭在5月中旬的财报会上亦表示,当前自研AI芯片的部署主要受限于产能。
一位国内头部云厂商人士告诉记者,在芯片供应短缺的情况下,厂商只能向客户承诺一周以内的报价有效期。南都记者留意到,有云厂商员工近期也曾在私域社交平台寻觅高端AI算力卡的租赁资源。
一名从事GPU服务器居间交易的人士表示,近期市场的需求量很大,是卖方市场,“只要有货,全都抢购。”另一位做居间生意的人士透露:“B300基本都买不着,到货就被扫光。”
AI基础设施创业公司新智惠想的创始人吴健向《财经》杂志形容,现在企业都是派人带着现金到各地芯片贸易商的库房里去抢货。抢到了就直接打现金,然后赶紧发走,后续再走合同。
不过,购置算力从事Token服务业务的孙铭(化名)认为,先取货打钱、后补合同的操作模式在实践中存在,但不是行业主流做法。这种交易模式必须建立在合作多次、有了信任的基础上,否则风险极高:无法确定这批货是否真的属于卖方,万一货物实际上是其他公司的,后续很可能引发法律纠纷。
高端AI算力货源紧俏,推动价格水涨船高。谢诚告诉记者,今年3月,一台H200服务器的价格还只有200多万元,如今已涨至340万元左右,而性能更先进的B300服务器则已达到700万元左右。这一报价也得到多位其他从业者的佐证。
在孙铭看来,市场能接受什么价位,取决于该产品跟竞品的对比。比如和华为昇腾、英伟达的老款服务器比,大家会衡量B300的性价比,判断到底值不值这个价。
[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
推荐:



