黃仁勳CES重磅宣布最新AI芯片:AI下半場終於來了

[CES] 黃仁勳CES重磅宣布最新AI芯片:AI下半場終於來了

2026-01-06 | 來源: 華爾街見聞 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

連接：?NVLink 6將機架內的通信帶寬推高至驚人的240 TB/s，是全球互聯網總帶寬的兩倍以上。

AI的下半場：從“死記硬背”到“邏輯思考”

演講中，黃仁勳敏銳地捕捉到了AI模型側的根本性變化——Test-time Scaling（測試時擴展）。

“推理不再是壹次性的回答，而是壹個思考的過程。”他指出，隨著DeepSeek R1和OpenAI o1等模型的出現，AI開始展現出思維鏈（Chain of Thought）能力。這意味著AI在給出答案前，需要消耗大量的算力進行多步推理、反思和規劃。

對於投資者而言，這是壹個巨大的增量信號：未來的算力消耗將從“訓練側”大規模轉移到“推理側”。為了支撐這種“讓AI多想壹會兒”的需求，算力必須足夠便宜。Rubin架構的核心使命，就是將MoE（混合專家模型）的推理Token生成成本降低至Blackwell的1/10。只有將成本打下來，能夠處理復雜任務的Agentic AI（代理智能體）才具備商業落地的可能性。

突破瓶頸：如何讓AI“記住”更長的對話

而當AI從簡單的問答轉向長時間的復雜推理時，壹個新的瓶頸出現了——記憶。

在Agentic AI時代，智能體需要記住漫長的對話歷史和復雜的上下文，這會產生巨大的KV Cache（鍵值緩存）。傳統的解決方案是將這些數據塞進昂貴的HBM顯存中，但HBM容量有限且價格高昂，這被稱為“顯存牆”。

黃仁勳詳細解釋了這壹問題：“AI的工作記憶存儲在HBM內存中。每生成壹個token，它都要讀取整個模型和所有工作記憶。”對於需要長期運行、擁有持續記憶的AI智能體，這種架構顯然不可持續。

解決方案是壹套全新的存儲架構。黃仁勳亮出了他的秘密武器：基於BlueField-4 DPU構建的推理上下文內存存儲平台（Inference Context Memory Storage Platform）。

[加西網正招聘多名全職sales 待遇優] 還沒人說話啊，我想來說幾句

分享:

上壹頁 1 234 5 6 ...17 下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

手機版本

專家專欄

新樓盤

當前會員

地產中文書籍

[CES] 黃仁勳CES重磅宣布最新AI芯片:AI下半場終於來了

意見