[CES] 黃仁勳CES重磅宣布最新AI芯片:AI下半場終於來了
Rubin推理成本較Blackwell降10倍:明確回應市場對AI太貴的質疑,Rubin將推理Token生成成本壓低至Blackwell的1/10,讓高昂的Agentic AI具備商業可行性。
解決AI“記憶”瓶頸:利用BlueField-4 DPU構建推理上下文內存存儲平台,為每顆GPU憑空增加16TB高速共享內存,徹底解決長文本“顯存牆”問題。
物理AI變現時刻:發布“具備推理能力”的自動駕駛模型Alpamayo,明確2026年Q1隨梅賽德斯-奔馳實車上路,開啟物理AI營收周期。
能源經濟學重構:Rubin架構支持45℃溫水冷卻,無需冷水機組,直接為全球數據中心節省6%的電力。
開源生態擴張:宣布擴展其開源模型生態,覆蓋物理AI、自動駕駛、機器人、生物醫學等多個關鍵領域,並提供配套數據集和工具鏈。
工業元宇宙落地:與西門子達成深度全棧合作,將英偉達AI技術植入全球工業制造底層,從“設計芯片”延伸至“設計工廠”。

新王亮相:Rubin平台全面投產,推理成本較Blackwell降10倍
“Vera Rubin已經全面投產。”黃仁勳宣布在CES展會推出新壹代Rubin AI平台,該平台通過六款新芯片的集成設計,在推理成本和訓練效率上實現大幅躍升,將於2026年下半年交付首批客戶。
這也是市場最為關切的消息。他將Rubin GPU形容為“壹只巨大的怪獸(It's a giant ship)”,並詳盡闡述了背後的邏輯:“AI的推理成本每年要下降10倍,而AI‘思考’(Test-time Scaling)產生的token數量每年增長5倍。”在這兩股力量的巨大拉扯下,傳統芯片的迭代節奏無法滿足要求。

黃仁勳用壹個生動的比喻來解釋新壹代AI芯片的設計思路:“這不是簡單地造壹個更好的引擎,而是重新設計整輛車,讓引擎、傳動、底盤協同工作。”“它的AI浮點性能是Blackwell的5倍,但晶體管數量僅為後者的1.6倍。”黃仁勳強調,這種超出摩爾定律常規預期的性能飛躍,源自於“極端協同設計”。
他所指的“協同”涵蓋了從CPU、GPU、網絡芯片到整個冷卻系統的全方位重構。這種設計的實際效果直接反映在市場最敏感的成本指標上:推理成本最高可降至Blackwell平台的1/10。具體來看:
算力:?Rubin GPU在NVFP4精度下的推理性能達到50 PFLOPS(Blackwell的5倍),訓練性能35 PFLOPS(較上代提升3.5倍)。每顆GPU封裝8組HBM4內存,帶寬高達22 TB/s。
CPU黑科技:?全新的Vera CPU集成了88個定制Olympus Arm核心,采用了壹種名為“空間多線程”(Spatial Multi-threading)的設計,可同時高效運行176個線程,解決了CPU跟不上GPU吞吐的痛點。
[加西網正招聘多名全職sales 待遇優]
好新聞沒人評論怎麼行,我來說幾句
解決AI“記憶”瓶頸:利用BlueField-4 DPU構建推理上下文內存存儲平台,為每顆GPU憑空增加16TB高速共享內存,徹底解決長文本“顯存牆”問題。
物理AI變現時刻:發布“具備推理能力”的自動駕駛模型Alpamayo,明確2026年Q1隨梅賽德斯-奔馳實車上路,開啟物理AI營收周期。
能源經濟學重構:Rubin架構支持45℃溫水冷卻,無需冷水機組,直接為全球數據中心節省6%的電力。
開源生態擴張:宣布擴展其開源模型生態,覆蓋物理AI、自動駕駛、機器人、生物醫學等多個關鍵領域,並提供配套數據集和工具鏈。
工業元宇宙落地:與西門子達成深度全棧合作,將英偉達AI技術植入全球工業制造底層,從“設計芯片”延伸至“設計工廠”。

新王亮相:Rubin平台全面投產,推理成本較Blackwell降10倍
“Vera Rubin已經全面投產。”黃仁勳宣布在CES展會推出新壹代Rubin AI平台,該平台通過六款新芯片的集成設計,在推理成本和訓練效率上實現大幅躍升,將於2026年下半年交付首批客戶。
這也是市場最為關切的消息。他將Rubin GPU形容為“壹只巨大的怪獸(It's a giant ship)”,並詳盡闡述了背後的邏輯:“AI的推理成本每年要下降10倍,而AI‘思考’(Test-time Scaling)產生的token數量每年增長5倍。”在這兩股力量的巨大拉扯下,傳統芯片的迭代節奏無法滿足要求。

黃仁勳用壹個生動的比喻來解釋新壹代AI芯片的設計思路:“這不是簡單地造壹個更好的引擎,而是重新設計整輛車,讓引擎、傳動、底盤協同工作。”“它的AI浮點性能是Blackwell的5倍,但晶體管數量僅為後者的1.6倍。”黃仁勳強調,這種超出摩爾定律常規預期的性能飛躍,源自於“極端協同設計”。
他所指的“協同”涵蓋了從CPU、GPU、網絡芯片到整個冷卻系統的全方位重構。這種設計的實際效果直接反映在市場最敏感的成本指標上:推理成本最高可降至Blackwell平台的1/10。具體來看:
算力:?Rubin GPU在NVFP4精度下的推理性能達到50 PFLOPS(Blackwell的5倍),訓練性能35 PFLOPS(較上代提升3.5倍)。每顆GPU封裝8組HBM4內存,帶寬高達22 TB/s。
CPU黑科技:?全新的Vera CPU集成了88個定制Olympus Arm核心,采用了壹種名為“空間多線程”(Spatial Multi-threading)的設計,可同時高效運行176個線程,解決了CPU跟不上GPU吞吐的痛點。
[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 | 更多... |
推薦:



