[CES] 黄仁勋CES重磅宣布最新AI芯片:AI下半场终于来了
Rubin推理成本较Blackwell降10倍:明确回应市场对AI太贵的质疑,Rubin将推理Token生成成本压低至Blackwell的1/10,让高昂的Agentic AI具备商业可行性。
解决AI“记忆”瓶颈:利用BlueField-4 DPU构建推理上下文内存存储平台,为每颗GPU凭空增加16TB高速共享内存,彻底解决长文本“显存墙”问题。
物理AI变现时刻:发布“具备推理能力”的自动驾驶模型Alpamayo,明确2026年Q1随梅赛德斯-奔驰实车上路,开启物理AI营收周期。
能源经济学重构:Rubin架构支持45℃温水冷却,无需冷水机组,直接为全球数据中心节省6%的电力。
开源生态扩张:宣布扩展其开源模型生态,覆盖物理AI、自动驾驶、机器人、生物医学等多个关键领域,并提供配套数据集和工具链。
工业元宇宙落地:与西门子达成深度全栈合作,将英伟达AI技术植入全球工业制造底层,从“设计芯片”延伸至“设计工厂”。

新王亮相:Rubin平台全面投产,推理成本较Blackwell降10倍
“Vera Rubin已经全面投产。”黄仁勋宣布在CES展会推出新一代Rubin AI平台,该平台通过六款新芯片的集成设计,在推理成本和训练效率上实现大幅跃升,将于2026年下半年交付首批客户。
这也是市场最为关切的消息。他将Rubin GPU形容为“一只巨大的怪兽(It's a giant ship)”,并详尽阐述了背后的逻辑:“AI的推理成本每年要下降10倍,而AI‘思考’(Test-time Scaling)产生的token数量每年增长5倍。”在这两股力量的巨大拉扯下,传统芯片的迭代节奏无法满足要求。

黄仁勋用一个生动的比喻来解释新一代AI芯片的设计思路:“这不是简单地造一个更好的引擎,而是重新设计整辆车,让引擎、传动、底盘协同工作。”“它的AI浮点性能是Blackwell的5倍,但晶体管数量仅为后者的1.6倍。”黄仁勋强调,这种超出摩尔定律常规预期的性能飞跃,源自于“极端协同设计”。
他所指的“协同”涵盖了从CPU、GPU、网络芯片到整个冷却系统的全方位重构。这种设计的实际效果直接反映在市场最敏感的成本指标上:推理成本最高可降至Blackwell平台的1/10。具体来看:
算力:?Rubin GPU在NVFP4精度下的推理性能达到50 PFLOPS(Blackwell的5倍),训练性能35 PFLOPS(较上代提升3.5倍)。每颗GPU封装8组HBM4内存,带宽高达22 TB/s。
CPU黑科技:?全新的Vera CPU集成了88个定制Olympus Arm核心,采用了一种名为“空间多线程”(Spatial Multi-threading)的设计,可同时高效运行176个线程,解决了CPU跟不上GPU吞吐的痛点。
[物价飞涨的时候 这样省钱购物很爽]
好新闻没人评论怎么行,我来说几句
解决AI“记忆”瓶颈:利用BlueField-4 DPU构建推理上下文内存存储平台,为每颗GPU凭空增加16TB高速共享内存,彻底解决长文本“显存墙”问题。
物理AI变现时刻:发布“具备推理能力”的自动驾驶模型Alpamayo,明确2026年Q1随梅赛德斯-奔驰实车上路,开启物理AI营收周期。
能源经济学重构:Rubin架构支持45℃温水冷却,无需冷水机组,直接为全球数据中心节省6%的电力。
开源生态扩张:宣布扩展其开源模型生态,覆盖物理AI、自动驾驶、机器人、生物医学等多个关键领域,并提供配套数据集和工具链。
工业元宇宙落地:与西门子达成深度全栈合作,将英伟达AI技术植入全球工业制造底层,从“设计芯片”延伸至“设计工厂”。

新王亮相:Rubin平台全面投产,推理成本较Blackwell降10倍
“Vera Rubin已经全面投产。”黄仁勋宣布在CES展会推出新一代Rubin AI平台,该平台通过六款新芯片的集成设计,在推理成本和训练效率上实现大幅跃升,将于2026年下半年交付首批客户。
这也是市场最为关切的消息。他将Rubin GPU形容为“一只巨大的怪兽(It's a giant ship)”,并详尽阐述了背后的逻辑:“AI的推理成本每年要下降10倍,而AI‘思考’(Test-time Scaling)产生的token数量每年增长5倍。”在这两股力量的巨大拉扯下,传统芯片的迭代节奏无法满足要求。

黄仁勋用一个生动的比喻来解释新一代AI芯片的设计思路:“这不是简单地造一个更好的引擎,而是重新设计整辆车,让引擎、传动、底盘协同工作。”“它的AI浮点性能是Blackwell的5倍,但晶体管数量仅为后者的1.6倍。”黄仁勋强调,这种超出摩尔定律常规预期的性能飞跃,源自于“极端协同设计”。
他所指的“协同”涵盖了从CPU、GPU、网络芯片到整个冷却系统的全方位重构。这种设计的实际效果直接反映在市场最敏感的成本指标上:推理成本最高可降至Blackwell平台的1/10。具体来看:
算力:?Rubin GPU在NVFP4精度下的推理性能达到50 PFLOPS(Blackwell的5倍),训练性能35 PFLOPS(较上代提升3.5倍)。每颗GPU封装8组HBM4内存,带宽高达22 TB/s。
CPU黑科技:?全新的Vera CPU集成了88个定制Olympus Arm核心,采用了一种名为“空间多线程”(Spatial Multi-threading)的设计,可同时高效运行176个线程,解决了CPU跟不上GPU吞吐的痛点。
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 | 更多... |
推荐: