黄仁勋的新故事:"Agent工厂"里,装的是什么?

02 “为Agent而生”的处理器
英伟达推出了专为智能体时代设计的新型处理器Vera,并已全面投产。
黄仁勋指出,内存系统的进步将推动存储系统进行创新和现代化升级。至今为止的所有CPU都是为人类打造的,而Vera是为AI时代设计的CPU,为智能体打造。
作为Grace的继任者,Vera采用了英伟达自主设计的“Olympus” CPU核心架构,核心数量从72个提升至88个,并大幅提高内存和数据处理能力。据英伟达介绍,在Agent相关工作负载测试中,Vera的任务执行速度达到同期x86服务器CPU的1.8倍。
相比单纯的性能提升,更重要的变化在于Vera与Rubin GPU之间的关系:Vera通过第二代NVLink-C2C与Rubin GPU连接,互联带宽达到1.8TB/s,Agent运行过程中在CPU和GPU之间传递数据的开销进一步降低。
黄仁勋表示,Vera Rubin采用美光、SK海力士和三星的HBM(高带宽内存),供应链规模是上一代Blackwell的“两倍”。不过,部署一个大型Blackwell机架需要两个小时,而Vera Rubin的时间被压缩到5分钟级别。

03 让AI工厂从“建设”走向“运营”
NVIDIA这次推出的DSX,可以理解为一套“AI工厂建设和运营工具箱”。
过去建设AI数据中心,客户需要分别考虑服务器、网络、电力、冷却、机房设计和运维系统,很多环节依赖不同供应商协同。DSX要做的,是把这些原本分散的环节放到同一个框架里,让客户从设计、仿真、建设到运营,都有一套可参考、可验证的标准方案。
黄仁勋在发布会现场表示:NVIDIA不只是卖芯片,而是要给基础设施建设者一套完整的AI工厂蓝图。
这次DSX最重要的新增能力主要有两个:
第一个是DSX MaxLPS。它解决的是AI工厂最现实的问题:在电力预算固定的情况下,如何放下更多GPU、跑出更多Token。
按照英伟达的说法,MaxLPS结合液冷和机架内功耗优化,可以让运营商在不明显影响性能的情况下,多运行最多40%的GPU。
第二个是DSX OS。它相当于AI工厂的运营软件,负责生命周期管理、智能调度、健康监测、故障恢复、多租户管理等工作。简单来说,如果AI工厂是一座复杂工厂,DSX OS负责让这座工厂持续稳定运转。
在DSX的产品矩阵当中,Reference Design提供AI工厂参考设计,告诉客户机房、机架、网络、电力和冷却系统应该如何搭建;DSX Sim负责仿真,让客户在建设前先验证设计是否可行;DSX Flex把AI工厂和电网连接起来,让数据中心可以根据电价、负荷和需求响应信号调整任务;DSX Exchange则负责打通IT系统、运营系统、能源和冷却系统之间的数据接口。
[加西网正招聘多名全职sales 待遇优]
| 分享: |
| Note: | _VIEW_NEWS_FULL |
| 延伸阅读 |
推荐:
黄仁勋的新故事:"Agent工厂"里,装的是什么?