亞馬遜技術大會強勢來襲:自研芯片性能暴增4.4倍

2025-12-02 | 來源: 騰訊科技 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

AWS表示，Trainium 3有望將AI模型全生命周期（訓練+推理）成本整體降低50%，在當前算力市場極具競爭力。在英偉達GPU長期占據絕對主導、價格居高不下的背景下，Trainium 3為企業提供了真正可落地的性價比替代方案。

架構層面，Trainium 3單芯片提供2.52 PFLOPs（FP8）算力，支持FP32、BF16、MXFP8及新增MXFP4等多種精度格式。為解決大語言模型最突出的內存瓶頸，該芯片將HBM3e內存容量提升至144GB、帶寬提升至4.9TB/s，同時強化結構化稀疏性和微縮放硬件支持，進壹步優化大語言模型訓練與推理效率。

得益於全新壹代Neuron Fabric互聯技術，單台Trn3 UltraServer可集成144張芯片，總算力達362 FP8 PFLOPs；通過EC2 UltraClusters 3.0架構，可擴展至最高100萬張芯片的超級集群，規模較上壹代提升10倍，已為Anthropic的“Project Rainier”項目提供核心算力支撐（目前已部署50萬張Trainium 2，計劃年底前擴容至100萬張）。Karakuri、Metagenomi、NetoAI等客戶反饋，使用 Trainium 3後訓練與推理成本最高降低 50%，充分驗證了其在真實生產環境中的成本優勢。

AWS提前披露Trainium 4關鍵特性

更具深遠影響的是，AWS提前披露了Trainium 4的關鍵特性：將原生支持英偉達NVLink Fusion高速互聯技術，徹底打破雲廠商自研芯片長期以來的“封閉生態”慣例，展現出“共存並競爭”的務實策略。目前全球約80%的AI應用基於英偉達CUDA生態開發，遷移成本極高。兼容NVLink Fusion後，企業可在同壹集群內靈活混搭Trainium與英偉達GPU，按需分配任務（如訓練用GPU、推理用Trainium），大幅降低遷移門檻。

Trainium 4預計FP8算力提升3倍、FP4算力提升6倍，內存帶寬與容量分別提升4倍和2倍，並將與Graviton CPU、EFA網絡及英偉達MGX機架深度融合。這壹“以開放換市場”的舉措，被業界視為 Trainium系列真正實現規模化普及的轉折點。

02.基礎設施延伸：AI工廠落地主權雲，混合部署壹舉破解全球合規難題

隨著AI深入政府、金融、醫療等高敏感行業，數據主權與合規性已成為全球性瓶頸。歐盟GDPR、美國國防與醫療安全審查等政策使得純公有雲難以滿足要求。AWS此次推出AI工廠服務，將全棧AI能力從公有雲完整延伸至客戶本地或指定區域，快速構建功能等同於私有AWS區域的專屬環境。

通過AI工廠，客戶可實現數據本地化處理與存儲，100%滿足數據主權與行業合規要求，AWS負責基礎設施全生命周期的部署、運維與升級，徹底解決傳統私有雲“部署難、維護貴”的問題。結合Trainium芯片、英偉達加速卡、高性能網絡以及Bedrock、SageMaker等全套服務，AI工廠將私有雲部署周期從數年縮短至數月。AWS同時宣布未來幾年投資500億美元建設美國政府專用高性能計算與AI數據中心，投入規模遠超同行。

[物價飛漲的時候這樣省錢購物很爽] 這條新聞還沒有人評論喔，等著您的高見呢

分享:

上壹頁 123 4 5 下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

手機版本

專家專欄

新樓盤

當前會員

地產中文書籍

亞馬遜技術大會強勢來襲:自研芯片性能暴增4.4倍

意見