直击GTC,老黄就指着你烧token了

2026-03-17 | 来源: 硅星人 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

整套NVL72系统100%液冷，用45度热水冷却，把原来花在空调上的能耗省回来给计算用。安装时间从两天压缩到两小时。第六代NVLink提供3.6TB/s全互连带宽。首款CPO（共封装光学）交换机Spectrum X已经量产。

目前，微软Azure已经跑起了第一套Vera Rubin机架，Satya Nadella在演讲期间直接发消息确认。

黄仁勋还给了一个极其直观的对比，同一个1GW数据中心，两年内token生成速率从2200万提升到7亿，350倍。他说这就是极致协同设计的力量。

1万亿GPU，和新的商业模式可能

在演讲里，黄仁勋再次给出数据的指引。

去年GTC他给出的关于英伟达产品的需求估算是5000亿美元（覆盖Blackwell和Rubin到2026年），而今年直接翻倍，他说现在看到的是：

到2027年至少1万亿美元。

驱动力是他反复提到的“推理拐点”，从ChatGPT到o1再到Claude Code，AI从能聊天变成能推理再变成能干活，每一步跳跃都让单次推理需要的算力暴增，而使用量也在同步起飞。黄仁勋说Claude Code是第一个agentic model，英伟达100%的软件工程师都在用。

然后他用一张图把这个宏观判断翻译成了具体的商业逻辑。

整场演讲最值得反复看的就是这张，标题叫inference Performance and Efficiency Drive Company Results。

纵轴是吞吐量（TPS/MW，每兆瓦每秒生成的token数），横轴是交互速度（TPS/User，每用户每秒拿到的token数）。横轴越往右意味着AI越“聪明”，模型更大、上下文更长、思考链更深，但吞吐量会下降，因为资源被单个用户的推理任务占用了更多。高吞吐和低延迟本质上矛盾。

[物价飞涨的时候这样省钱购物很爽] 还没人说话啊，我想来说几句

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

手机版本

专家专栏

新楼盘

当前会员

地产中文书籍

直击GTC,老黄就指着你烧token了

意见