一文读懂英伟达GTC 2026:给"龙虾"装安全围栏

2026-03-16 | 来源: 腾讯科技 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

Vera CPU采用LPDDR5X内存，带宽高达1.2TB/s，是同类通用CPU的两倍，功耗仅为一半。结合NVLink-C2C技术，其与GPU间的互联带宽达1.8 TB/s，是传统PCIe Gen 6的7倍。

单个 Vera CPU机架可集成256颗液冷方案Vera CPU，支持超过22500个并发线程独立满负荷运行，专为大规模“AI工厂”而生。

据介绍，目前已计划部署Vera CPU的云客户包括：Meta、Oracle Cloud、CoreWeave 等；制造合作商涵盖戴尔、HPE、联想、超微电脑、华硕、富士康等。Redpanda 的测试显示，Vera在处理实时数据流时的延迟降低了 5.5倍。相关产品预计将于2026年下半年上市。

03 Groq 3 LPX/LPU：填补GPU推理短板，超低延迟推理加速器

Groq 3 LPU芯片是英伟达专为极致低延迟推理设计的全新处理器。

在AI智能体时代，推理侧需求正加速分化：大模型训练依赖GPU的高吞吐算力，而面对需要极高交互性、超短响应时间的智能体任务，传统GPU架构存在性能冗余。为此，英伟达正式引入LPU架构，专注于“极致低延迟的token生成”。

在硬件设计上，Groq 3 LPU芯片展现了与传统GPU截然不同的技术路线。它摒弃了容量大但延迟相对较高的HBM显存，单颗芯片集成了500MB的片上SRAM。虽然容量仅为Rubin GPU 的五百分之一，但其提供的带宽高达150 TB/s，是HBM4（22 TB/s)的近7倍。

基于该芯片，英伟达推出了Groq 3 LPX平台（机架）。该平台采用液冷散热，单个机架配备 256颗LPU处理器，累计提供128GB片上SRAM，总扩展带宽达640TB/s。LPX平台作为Vera Rubin架构中的关键补齐，专注于承载大规模、高并发的低延迟推理工作负载。

当Groq 3 LPX平台与Vera Rubin NVL72结合使用时，这种混合架构实现了GPU强劲算力与 LPU极致带宽的完美互补。在百万token上下文场景下，其收益潜力可大幅提升。该芯片及平台预计将于2026年下半年正式上市。

04 Vera Rubin Space Module：AI 算力飞向太空

英伟达这次还把AI算力直接送上了太空，发布了专门面向轨道数据中心（ODC）和太空操作的 Vera Rubin Space Module。

根据介绍，传统卫星的工作模式是拍摄后将海量数据下载到地面处理，但这套流程正被“数据洪流”压垮。因为一颗地球观测卫星每天可产生数TB数据，而星地通信带宽有限、窗口期短，大量数据积压等待传输。从拍摄到分析结果返回可能耗时数小时，错过灾害预警等场景的黄金窗口。

Vera Rubin Space Module 的核心思路是边缘智能，让卫星在轨完成目标检测和变化分析，只下传有价值的结果而非原始数据，从而大幅降低传输压力。

英伟达表示，目前，像Axiom Space、Planet Labs这些太空赛道的头牌公司，已开始用英伟达的加速平台来跑下一代太空任务了。有了这种算力加持，无论是卫星自主运行还是地理空间智能分析，都将从“慢动作”变成实时响应。

黄仁勋表示：“相比H100 GPU，Rubin Space Module在太空推理算力上提升最高25倍，真正将数据中心级AI算力带入太空”。

05 BlueField-4 STX：AI 原生存储架构

[物价飞涨的时候这样省钱购物很爽] 这条新闻还没有人评论喔，等着您的高见呢

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

专家专栏

工具

当前会员

一文读懂英伟达GTC 2026:给"龙虾"装安全围栏

意见