黄仁勋CES重磅宣布最新AI芯片:AI下半场终于来了

[CES] 黄仁勋CES重磅宣布最新AI芯片:AI下半场终于来了

2026-01-06 | 来源: 华尔街见闻 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

Rubin推理成本较Blackwell降10倍：明确回应市场对AI太贵的质疑，Rubin将推理Token生成成本压低至Blackwell的1/10，让高昂的Agentic AI具备商业可行性。

解决AI“记忆”瓶颈：利用BlueField-4 DPU构建推理上下文内存存储平台，为每颗GPU凭空增加16TB高速共享内存，彻底解决长文本“显存墙”问题。

物理AI变现时刻：发布“具备推理能力”的自动驾驶模型Alpamayo，明确2026年Q1随梅赛德斯-奔驰实车上路，开启物理AI营收周期。

能源经济学重构：Rubin架构支持45℃温水冷却，无需冷水机组，直接为全球数据中心节省6%的电力。

开源生态扩张：宣布扩展其开源模型生态，覆盖物理AI、自动驾驶、机器人、生物医学等多个关键领域，并提供配套数据集和工具链。

工业元宇宙落地：与西门子达成深度全栈合作，将英伟达AI技术植入全球工业制造底层，从“设计芯片”延伸至“设计工厂”。

新王亮相：Rubin平台全面投产，推理成本较Blackwell降10倍

“Vera Rubin已经全面投产。”黄仁勋宣布在CES展会推出新一代Rubin AI平台，该平台通过六款新芯片的集成设计，在推理成本和训练效率上实现大幅跃升，将于2026年下半年交付首批客户。

这也是市场最为关切的消息。他将Rubin GPU形容为“一只巨大的怪兽（It's a giant ship）”，并详尽阐述了背后的逻辑：“AI的推理成本每年要下降10倍，而AI‘思考’（Test-time Scaling）产生的token数量每年增长5倍。”在这两股力量的巨大拉扯下，传统芯片的迭代节奏无法满足要求。

黄仁勋用一个生动的比喻来解释新一代AI芯片的设计思路：“这不是简单地造一个更好的引擎，而是重新设计整辆车，让引擎、传动、底盘协同工作。”“它的AI浮点性能是Blackwell的5倍，但晶体管数量仅为后者的1.6倍。”黄仁勋强调，这种超出摩尔定律常规预期的性能飞跃，源自于“极端协同设计”。

他所指的“协同”涵盖了从CPU、GPU、网络芯片到整个冷却系统的全方位重构。这种设计的实际效果直接反映在市场最敏感的成本指标上：推理成本最高可降至Blackwell平台的1/10。具体来看：

算力：?Rubin GPU在NVFP4精度下的推理性能达到50 PFLOPS（Blackwell的5倍），训练性能35 PFLOPS（较上代提升3.5倍）。每颗GPU封装8组HBM4内存，带宽高达22 TB/s。

CPU黑科技：?全新的Vera CPU集成了88个定制Olympus Arm核心，采用了一种名为“空间多线程”（Spatial Multi-threading）的设计，可同时高效运行176个线程，解决了CPU跟不上GPU吞吐的痛点。

[物价飞涨的时候这样省钱购物很爽] 好新闻没人评论怎么行，我来说几句

分享:

上一页 123 4 5 ...17 下一页

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

专家专栏

工具

当前会员

[CES] 黄仁勋CES重磅宣布最新AI芯片:AI下半场终于来了

意见