Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_c6937d1034116832b0a02462bab6b001, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
亞馬遜技術大會強勢來襲:自研芯片性能暴增4.4倍 | 溫哥華地產中心
   

亞馬遜技術大會強勢來襲:自研芯片性能暴增4.4倍

AWS表示,Trainium 3有望將AI模型全生命周期(訓練+推理)成本整體降低50%,在當前算力市場極具競爭力。在英偉達GPU長期占據絕對主導、價格居高不下的背景下,Trainium 3為企業提供了真正可落地的性價比替代方案。


架構層面,Trainium 3單芯片提供2.52 PFLOPs(FP8)算力,支持FP32、BF16、MXFP8及新增MXFP4等多種精度格式。為解決大語言模型最突出的內存瓶頸,該芯片將HBM3e內存容量提升至144GB、帶寬提升至4.9TB/s,同時強化結構化稀疏性和微縮放硬件支持,進壹步優化大語言模型訓練與推理效率。

得益於全新壹代Neuron Fabric互聯技術,單台Trn3 UltraServer可集成144張芯片,總算力達362 FP8 PFLOPs;通過EC2 UltraClusters 3.0架構,可擴展至最高100萬張芯片的超級集群,規模較上壹代提升10倍,已為Anthropic的“Project Rainier”項目提供核心算力支撐(目前已部署50萬張Trainium 2,計劃年底前擴容至100萬張)。Karakuri、Metagenomi、NetoAI等客戶反饋,使用 Trainium 3後訓練與推理成本最高降低 50%,充分驗證了其在真實生產環境中的成本優勢。



AWS提前披露Trainium 4關鍵特性

更具深遠影響的是,AWS提前披露了Trainium 4的關鍵特性:將原生支持英偉達NVLink Fusion高速互聯技術,徹底打破雲廠商自研芯片長期以來的“封閉生態”慣例,展現出“共存並競爭”的務實策略。目前全球約80%的AI應用基於英偉達CUDA生態開發,遷移成本極高。兼容NVLink Fusion後,企業可在同壹集群內靈活混搭Trainium與英偉達GPU,按需分配任務(如訓練用GPU、推理用Trainium),大幅降低遷移門檻。

Trainium 4預計FP8算力提升3倍、FP4算力提升6倍,內存帶寬與容量分別提升4倍和2倍,並將與Graviton CPU、EFA網絡及英偉達MGX機架深度融合。這壹“以開放換市場”的舉措,被業界視為 Trainium系列真正實現規模化普及的轉折點。

02.基礎設施延伸:AI工廠落地主權雲,混合部署壹舉破解全球合規難題




隨著AI深入政府、金融、醫療等高敏感行業,數據主權與合規性已成為全球性瓶頸。歐盟GDPR、美國國防與醫療安全審查等政策使得純公有雲難以滿足要求。AWS此次推出AI工廠服務,將全棧AI能力從公有雲完整延伸至客戶本地或指定區域,快速構建功能等同於私有AWS區域的專屬環境。

通過AI工廠,客戶可實現數據本地化處理與存儲,100%滿足數據主權與行業合規要求,AWS負責基礎設施全生命周期的部署、運維與升級,徹底解決傳統私有雲“部署難、維護貴”的問題。結合Trainium芯片、英偉達加速卡、高性能網絡以及Bedrock、SageMaker等全套服務,AI工廠將私有雲部署周期從數年縮短至數月。AWS同時宣布未來幾年投資500億美元建設美國政府專用高性能計算與AI數據中心,投入規模遠超同行。

[物價飛漲的時候 這樣省錢購物很爽]
這條新聞還沒有人評論喔,等著您的高見呢
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)

    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站