看傻了!凌晨1点,老黄扔"核弹"...
一年一度的 CES 来了,和往年一样,我最期待的是英伟达老黄的演讲。
那么今年他还能带来什么重磅吗?
话不多说,直接进正题。
那个穿皮衣的男人没有废话,直接扔出了一枚足以让整个 AI 行业重新洗牌的“终极武器”——Vera Rubin 平台。
为了不浪费大家时间,90 分钟的发布会,我提炼了最核心的 2 个“核弹级”重点,让大家快速了解一下。
01|算力暴涨 5 倍:Vera Rubin 架构有多变态?
老黄这次彻底不装了。
面对 AI 对算力近乎变态的渴求,他给出的方案简单粗暴:推倒重来。
全新的 Vera Rubin 芯片,架构极其激进:1 个 Vera CPU + 2 个 Rubin GPU。
这一改,数据直接吓人:
推理性能:相比上一代(Grace Blackwell)直接暴涨 5 倍。
训练性能:提升 3.5 倍。
能效控制:以前还是风冷液冷混合,现在直接上 100% 全液冷。

图:Vera 和 Rubin 芯片

图:NVIDIA Rubin Boxes

图:Rubin GPU
相比前一代,Vera Rubin 将 token 成本降低了 90%,训练 MoE 模型所需的 GPU 数量减少 4 倍。但光有算力没用,数据传不过去也是白搭。
这也是这次发布会被很多人忽视、但极其重要的升级——网络。
[加西网正招聘多名全职sales 待遇优]
好新闻没人评论怎么行,我来说几句
那么今年他还能带来什么重磅吗?
话不多说,直接进正题。
那个穿皮衣的男人没有废话,直接扔出了一枚足以让整个 AI 行业重新洗牌的“终极武器”——Vera Rubin 平台。
为了不浪费大家时间,90 分钟的发布会,我提炼了最核心的 2 个“核弹级”重点,让大家快速了解一下。
01|算力暴涨 5 倍:Vera Rubin 架构有多变态?
老黄这次彻底不装了。
面对 AI 对算力近乎变态的渴求,他给出的方案简单粗暴:推倒重来。
全新的 Vera Rubin 芯片,架构极其激进:1 个 Vera CPU + 2 个 Rubin GPU。
这一改,数据直接吓人:
推理性能:相比上一代(Grace Blackwell)直接暴涨 5 倍。
训练性能:提升 3.5 倍。
能效控制:以前还是风冷液冷混合,现在直接上 100% 全液冷。

图:Vera 和 Rubin 芯片

图:NVIDIA Rubin Boxes

图:Rubin GPU
相比前一代,Vera Rubin 将 token 成本降低了 90%,训练 MoE 模型所需的 GPU 数量减少 4 倍。但光有算力没用,数据传不过去也是白搭。
这也是这次发布会被很多人忽视、但极其重要的升级——网络。
[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
推荐:
看傻了!凌晨1点,老黄扔"核弹"...