亞馬遜技術大會強勢來襲:自研芯片性能暴增4.4倍
AWS表示,Trainium 3有望將AI模型全生命周期(訓練+推理)成本整體降低50%,在當前算力市場極具競爭力。在英偉達GPU長期占據絕對主導、價格居高不下的背景下,Trainium 3為企業提供了真正可落地的性價比替代方案。
架構層面,Trainium 3單芯片提供2.52 PFLOPs(FP8)算力,支持FP32、BF16、MXFP8及新增MXFP4等多種精度格式。為解決大語言模型最突出的內存瓶頸,該芯片將HBM3e內存容量提升至144GB、帶寬提升至4.9TB/s,同時強化結構化稀疏性和微縮放硬件支持,進壹步優化大語言模型訓練與推理效率。
得益於全新壹代Neuron Fabric互聯技術,單台Trn3 UltraServer可集成144張芯片,總算力達362 FP8 PFLOPs;通過EC2 UltraClusters 3.0架構,可擴展至最高100萬張芯片的超級集群,規模較上壹代提升10倍,已為Anthropic的“Project Rainier”項目提供核心算力支撐(目前已部署50萬張Trainium 2,計劃年底前擴容至100萬張)。Karakuri、Metagenomi、NetoAI等客戶反饋,使用 Trainium 3後訓練與推理成本最高降低 50%,充分驗證了其在真實生產環境中的成本優勢。

AWS提前披露Trainium 4關鍵特性
更具深遠影響的是,AWS提前披露了Trainium 4的關鍵特性:將原生支持英偉達NVLink Fusion高速互聯技術,徹底打破雲廠商自研芯片長期以來的“封閉生態”慣例,展現出“共存並競爭”的務實策略。目前全球約80%的AI應用基於英偉達CUDA生態開發,遷移成本極高。兼容NVLink Fusion後,企業可在同壹集群內靈活混搭Trainium與英偉達GPU,按需分配任務(如訓練用GPU、推理用Trainium),大幅降低遷移門檻。
Trainium 4預計FP8算力提升3倍、FP4算力提升6倍,內存帶寬與容量分別提升4倍和2倍,並將與Graviton CPU、EFA網絡及英偉達MGX機架深度融合。這壹“以開放換市場”的舉措,被業界視為 Trainium系列真正實現規模化普及的轉折點。
02.基礎設施延伸:AI工廠落地主權雲,混合部署壹舉破解全球合規難題

隨著AI深入政府、金融、醫療等高敏感行業,數據主權與合規性已成為全球性瓶頸。歐盟GDPR、美國國防與醫療安全審查等政策使得純公有雲難以滿足要求。AWS此次推出AI工廠服務,將全棧AI能力從公有雲完整延伸至客戶本地或指定區域,快速構建功能等同於私有AWS區域的專屬環境。
通過AI工廠,客戶可實現數據本地化處理與存儲,100%滿足數據主權與行業合規要求,AWS負責基礎設施全生命周期的部署、運維與升級,徹底解決傳統私有雲“部署難、維護貴”的問題。結合Trainium芯片、英偉達加速卡、高性能網絡以及Bedrock、SageMaker等全套服務,AI工廠將私有雲部署周期從數年縮短至數月。AWS同時宣布未來幾年投資500億美元建設美國政府專用高性能計算與AI數據中心,投入規模遠超同行。
[物價飛漲的時候 這樣省錢購物很爽]
這條新聞還沒有人評論喔,等著您的高見呢
架構層面,Trainium 3單芯片提供2.52 PFLOPs(FP8)算力,支持FP32、BF16、MXFP8及新增MXFP4等多種精度格式。為解決大語言模型最突出的內存瓶頸,該芯片將HBM3e內存容量提升至144GB、帶寬提升至4.9TB/s,同時強化結構化稀疏性和微縮放硬件支持,進壹步優化大語言模型訓練與推理效率。
得益於全新壹代Neuron Fabric互聯技術,單台Trn3 UltraServer可集成144張芯片,總算力達362 FP8 PFLOPs;通過EC2 UltraClusters 3.0架構,可擴展至最高100萬張芯片的超級集群,規模較上壹代提升10倍,已為Anthropic的“Project Rainier”項目提供核心算力支撐(目前已部署50萬張Trainium 2,計劃年底前擴容至100萬張)。Karakuri、Metagenomi、NetoAI等客戶反饋,使用 Trainium 3後訓練與推理成本最高降低 50%,充分驗證了其在真實生產環境中的成本優勢。

AWS提前披露Trainium 4關鍵特性
更具深遠影響的是,AWS提前披露了Trainium 4的關鍵特性:將原生支持英偉達NVLink Fusion高速互聯技術,徹底打破雲廠商自研芯片長期以來的“封閉生態”慣例,展現出“共存並競爭”的務實策略。目前全球約80%的AI應用基於英偉達CUDA生態開發,遷移成本極高。兼容NVLink Fusion後,企業可在同壹集群內靈活混搭Trainium與英偉達GPU,按需分配任務(如訓練用GPU、推理用Trainium),大幅降低遷移門檻。
Trainium 4預計FP8算力提升3倍、FP4算力提升6倍,內存帶寬與容量分別提升4倍和2倍,並將與Graviton CPU、EFA網絡及英偉達MGX機架深度融合。這壹“以開放換市場”的舉措,被業界視為 Trainium系列真正實現規模化普及的轉折點。
02.基礎設施延伸:AI工廠落地主權雲,混合部署壹舉破解全球合規難題

隨著AI深入政府、金融、醫療等高敏感行業,數據主權與合規性已成為全球性瓶頸。歐盟GDPR、美國國防與醫療安全審查等政策使得純公有雲難以滿足要求。AWS此次推出AI工廠服務,將全棧AI能力從公有雲完整延伸至客戶本地或指定區域,快速構建功能等同於私有AWS區域的專屬環境。
通過AI工廠,客戶可實現數據本地化處理與存儲,100%滿足數據主權與行業合規要求,AWS負責基礎設施全生命周期的部署、運維與升級,徹底解決傳統私有雲“部署難、維護貴”的問題。結合Trainium芯片、英偉達加速卡、高性能網絡以及Bedrock、SageMaker等全套服務,AI工廠將私有雲部署周期從數年縮短至數月。AWS同時宣布未來幾年投資500億美元建設美國政府專用高性能計算與AI數據中心,投入規模遠超同行。
[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
推薦:



