英伟达发布Vera Rubin AI平台:开启Agentic AI全生命周期新纪元

SmartHey3月17日消息,3月17日在美国加州圣何塞举行的2026年GTC大会上,英伟达正式推出面向智能体AI(Agentic AI)的全新基础设施平台——Vera Rubin AI平台。

英伟达创始人兼首席执行官黄仁勋指出,Vera Rubin代表一次代际跃迁,标志着英伟达迄今规模最大的AI基础设施建设全面启动,完整支撑从超大规模预训练、持续学习到低延迟实时智能体推理的AI全生命周期。

在核心算力方面,新一代NVL72机架实现能效与密度双重突破:通过NVLink 6高速互连技术,集成72块Rubin GPU与36块Vera CPU,构建统一异构计算底座。

相较上一代Blackwell平台,该系统仅需四分之一数量的GPU即可完成混合专家大模型(MoE)训练;单瓦特推理吞吐量提升达10倍,单Token推理成本降低至原先的十分之一。

专为AI模型可信验证而设计的Vera CPU机架,搭载256颗液冷高性能CPU,能效比传统CPU提升2倍,运算速度提高50%,显著强化智能体决策链路中的结果校验能力。

为满足智能体系统对毫秒级响应与超长上下文处理的严苛要求,英伟达同步推出Groq 3 LPX推理加速机架。该系统集成256个低延迟LPU处理器,与Vera Rubin平台协同工作后,每兆瓦推理吞吐量最高可达前代方案的35倍。

在数据存储层面,全新BlueField-4 STX机架打造原生适配AI工作负载的存储架构。依托创新的DOCA Memos框架,该系统可高效调度和管理大语言模型运行中产生的海量键值(KV)缓存,在显著降低功耗的同时,将推理吞吐量最高提升5倍,有力支撑复杂多轮AI交互场景。