Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_c6937d1034116832b0a02462bab6b001, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
黃仁勳CES重磅宣布最新AI芯片:AI下半場終於來了 | 溫哥華地產中心
   

[CES] 黃仁勳CES重磅宣布最新AI芯片:AI下半場終於來了

連接:?NVLink 6將機架內的通信帶寬推高至驚人的240 TB/s,是全球互聯網總帶寬的兩倍以上。






AI的下半場:從“死記硬背”到“邏輯思考”

演講中,黃仁勳敏銳地捕捉到了AI模型側的根本性變化——Test-time Scaling(測試時擴展)。

“推理不再是壹次性的回答,而是壹個思考的過程。”他指出,隨著DeepSeek R1和OpenAI o1等模型的出現,AI開始展現出思維鏈(Chain of Thought)能力。這意味著AI在給出答案前,需要消耗大量的算力進行多步推理、反思和規劃。

對於投資者而言,這是壹個巨大的增量信號:未來的算力消耗將從“訓練側”大規模轉移到“推理側”。為了支撐這種“讓AI多想壹會兒”的需求,算力必須足夠便宜。Rubin架構的核心使命,就是將MoE(混合專家模型)的推理Token生成成本降低至Blackwell的1/10。只有將成本打下來,能夠處理復雜任務的Agentic AI(代理智能體)才具備商業落地的可能性。

突破瓶頸:如何讓AI“記住”更長的對話

而當AI從簡單的問答轉向長時間的復雜推理時,壹個新的瓶頸出現了——記憶。


在Agentic AI時代,智能體需要記住漫長的對話歷史和復雜的上下文,這會產生巨大的KV Cache(鍵值緩存)。傳統的解決方案是將這些數據塞進昂貴的HBM顯存中,但HBM容量有限且價格高昂,這被稱為“顯存牆”。

黃仁勳詳細解釋了這壹問題:“AI的工作記憶存儲在HBM內存中。每生成壹個token,它都要讀取整個模型和所有工作記憶。”對於需要長期運行、擁有持續記憶的AI智能體,這種架構顯然不可持續。

解決方案是壹套全新的存儲架構。黃仁勳亮出了他的秘密武器:基於BlueField-4 DPU構建的推理上下文內存存儲平台(Inference Context Memory Storage Platform)。



[加西網正招聘多名全職sales 待遇優]
還沒人說話啊,我想來說幾句
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     延伸閱讀 更多...
    CES 2026登場!AI、家用機器人成科技風向標 2025科技界"潮"什麼?美CES展告訴你
    中國SpaceSail搶食衛星大餅 星鏈龍頭地位受挑戰 CES拾大最酷黑科技!有億點點抽象
    千家中企參展美國CES九成被拒簽 華為亮相CES2020引老外瘋狂體驗  (1條評論)
    伊萬卡首秀CES尬聊科技 業內群嘲 CES展50周年 呈現新趨勢新潮流
    中國企業為CES帶去哪些黑科技? CES最熱的新技術:家用機器人(圖)
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)

    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站