9月10日,英伟达正式发布了其最新研发的产品Rubin CPX,这是一款专为处理大规模上下文任务而设计的专用GPU。该产品针对高要求的工作负载进行了优化,如大规模编码和生成视频等。
这款硬件能够明确区分AI提示理解和响应生成两大任务,英伟达表示这种分离将显著提高整体效率,并为客户提供更优的服务体验。
Rubin CPX预计将作为Vera Rubin平台的重要组成部分,该平台同时集成了Vera CPU和Rubin GPU。英伟达宣称,全机架版本的Vera Rubin NVL144 CPX具备惊人的8 exaflops AI性能。
据英伟达新闻稿介绍,独立的Rubin CPX GPU配置了128GB GDDR7显存。该硬件在性能上实现了显著突破,具备3倍于前代产品的注意力机制能力,并通过4-bit NVFP4精度提供高达30 petaflops的计算性能。
英伟达首席执行官黄仁勋将Rubin CPX与广为人知的RTX系列进行了对比,他表示:”就像RTX革新了图形和物理AI一样,Rubin CPX是首款专为大规模上下文AI设计的CUDA GPU,能够同时处理跨越数百万知识符号的复杂模型。”他还强调了投资Rubin CPX的巨大回报,指出初始1亿美元的投资有望带来50亿美元的收益。
在软件支持方面,英伟达承诺为Rubin CPX提供全面的生态系统,包括其最新的Nemotron系列模型。这些开放的多模态模型专为构建企业级AI代理设计,能够自主处理复杂的任务。Nemotron模型提供了多样化的配置选择,从适用于设备端应用的Nano版本,到适合单GPU环境的Super型号,再到针对大型数据中心的Ultra规模。
最后,英伟达确认Rubin CPX预计将于2026年底正式上市。
© 版权声明
文章版权归作者所有,未经允许请勿转载。