[CES] 黃仁勳CES重磅宣布最新AI芯片:AI下半場終於來了
連接:?NVLink 6將機架內的通信帶寬推高至驚人的240 TB/s,是全球互聯網總帶寬的兩倍以上。


AI的下半場:從“死記硬背”到“邏輯思考”
演講中,黃仁勳敏銳地捕捉到了AI模型側的根本性變化——Test-time Scaling(測試時擴展)。
“推理不再是壹次性的回答,而是壹個思考的過程。”他指出,隨著DeepSeek R1和OpenAI o1等模型的出現,AI開始展現出思維鏈(Chain of Thought)能力。這意味著AI在給出答案前,需要消耗大量的算力進行多步推理、反思和規劃。
對於投資者而言,這是壹個巨大的增量信號:未來的算力消耗將從“訓練側”大規模轉移到“推理側”。為了支撐這種“讓AI多想壹會兒”的需求,算力必須足夠便宜。Rubin架構的核心使命,就是將MoE(混合專家模型)的推理Token生成成本降低至Blackwell的1/10。只有將成本打下來,能夠處理復雜任務的Agentic AI(代理智能體)才具備商業落地的可能性。
突破瓶頸:如何讓AI“記住”更長的對話
而當AI從簡單的問答轉向長時間的復雜推理時,壹個新的瓶頸出現了——記憶。
在Agentic AI時代,智能體需要記住漫長的對話歷史和復雜的上下文,這會產生巨大的KV Cache(鍵值緩存)。傳統的解決方案是將這些數據塞進昂貴的HBM顯存中,但HBM容量有限且價格高昂,這被稱為“顯存牆”。
黃仁勳詳細解釋了這壹問題:“AI的工作記憶存儲在HBM內存中。每生成壹個token,它都要讀取整個模型和所有工作記憶。”對於需要長期運行、擁有持續記憶的AI智能體,這種架構顯然不可持續。
解決方案是壹套全新的存儲架構。黃仁勳亮出了他的秘密武器:基於BlueField-4 DPU構建的推理上下文內存存儲平台(Inference Context Memory Storage Platform)。

[加西網正招聘多名全職sales 待遇優]
還沒人說話啊,我想來說幾句


AI的下半場:從“死記硬背”到“邏輯思考”
演講中,黃仁勳敏銳地捕捉到了AI模型側的根本性變化——Test-time Scaling(測試時擴展)。
“推理不再是壹次性的回答,而是壹個思考的過程。”他指出,隨著DeepSeek R1和OpenAI o1等模型的出現,AI開始展現出思維鏈(Chain of Thought)能力。這意味著AI在給出答案前,需要消耗大量的算力進行多步推理、反思和規劃。
對於投資者而言,這是壹個巨大的增量信號:未來的算力消耗將從“訓練側”大規模轉移到“推理側”。為了支撐這種“讓AI多想壹會兒”的需求,算力必須足夠便宜。Rubin架構的核心使命,就是將MoE(混合專家模型)的推理Token生成成本降低至Blackwell的1/10。只有將成本打下來,能夠處理復雜任務的Agentic AI(代理智能體)才具備商業落地的可能性。
突破瓶頸:如何讓AI“記住”更長的對話
而當AI從簡單的問答轉向長時間的復雜推理時,壹個新的瓶頸出現了——記憶。
在Agentic AI時代,智能體需要記住漫長的對話歷史和復雜的上下文,這會產生巨大的KV Cache(鍵值緩存)。傳統的解決方案是將這些數據塞進昂貴的HBM顯存中,但HBM容量有限且價格高昂,這被稱為“顯存牆”。
黃仁勳詳細解釋了這壹問題:“AI的工作記憶存儲在HBM內存中。每生成壹個token,它都要讀取整個模型和所有工作記憶。”對於需要長期運行、擁有持續記憶的AI智能體,這種架構顯然不可持續。
解決方案是壹套全新的存儲架構。黃仁勳亮出了他的秘密武器:基於BlueField-4 DPU構建的推理上下文內存存儲平台(Inference Context Memory Storage Platform)。

[加西網正招聘多名全職sales 待遇優]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 | 更多... |
推薦:



