英伟达推出首款专为大语言模型设计的GPU

252 0 0

9月10日，英伟达正式发布了其最新研发的产品Rubin CPX，这是一款专为处理大规模上下文任务而设计的专用GPU。该产品针对高要求的工作负载进行了优化，如大规模编码和生成视频等。

这款硬件能够明确区分AI提示理解和响应生成两大任务，英伟达表示这种分离将显著提高整体效率，并为客户提供更优的服务体验。

Rubin CPX预计将作为Vera Rubin平台的重要组成部分，该平台同时集成了Vera CPU和Rubin GPU。英伟达宣称，全机架版本的Vera Rubin NVL144 CPX具备惊人的8 exaflops AI性能。

据英伟达新闻稿介绍，独立的Rubin CPX GPU配置了128GB GDDR7显存。该硬件在性能上实现了显著突破，具备3倍于前代产品的注意力机制能力，并通过4-bit NVFP4精度提供高达30 petaflops的计算性能。

英伟达首席执行官黄仁勋将Rubin CPX与广为人知的RTX系列进行了对比，他表示：”就像RTX革新了图形和物理AI一样，Rubin CPX是首款专为大规模上下文AI设计的CUDA GPU，能够同时处理跨越数百万知识符号的复杂模型。”他还强调了投资Rubin CPX的巨大回报，指出初始1亿美元的投资有望带来50亿美元的收益。

在软件支持方面，英伟达承诺为Rubin CPX提供全面的生态系统，包括其最新的Nemotron系列模型。这些开放的多模态模型专为构建企业级AI代理设计，能够自主处理复杂的任务。Nemotron模型提供了多样化的配置选择，从适用于设备端应用的Nano版本，到适合单GPU环境的Super型号，再到针对大型数据中心的Ultra规模。

最后，英伟达确认Rubin CPX预计将于2026年底正式上市。

# AI资讯