英伟达发布全球最大10万亿token开源数据集并推出四大AI模型

AI资讯1个月前发布 ainav
38 0

1月6日,在2026年CES大会上,英伟达首席执行官黄仁勋发表了主题演讲,宣布对其开源模型库进行大规模扩展。在此次发布会上,英伟达推出了一系列全新的AI模型和数据集,涵盖语言、机器人、自动驾驶以及医疗健康四大领域,此举标志着全球AI创新即将迎来新一轮的加速发展。

英伟达发布全球最大10万亿token开源数据集并推出四大AI模型

图源:英伟达官方博客

此次发布标志着英伟达正式迈入AI开源的新纪元。公司不仅开放了包括训练框架在内的多项技术资源,更推出了全球最大的多模态数据集。这些数据集包含10万亿个语言训练tokens、50万条机器人轨迹记录、45.5万个蛋白质结构信息以及100TB的车辆传感器数据。这一系列举措彰显出英伟达构建开放生态系统、推动跨领域技术融合的决心。

目前,包括博世(Bosch)、Salesforce、优步(Uber)和帕兰泰尔(Palantir)等全球科技巨头均已宣布将基于这些开源技术构建下一代AI系统。这表明英伟达的开源战略已获得广泛认可,并在产业界引发强烈反响。

本次发布主要包含四大类产品:智能体AI、物理AI、自动驾驶和医疗AI模型。其中,Nemotron系列模型专为智能体设计,旨在提升语音交互和内容安全;Cosmos平台则聚焦于机器人技术,帮助机器实现类人推理能力;Alpamayo系列专注于自动驾驶解决方案;而Clara模型则致力于生物医学领域的突破。

Nemotron:智能体AI的性能革命

针对智能体AI领域,英伟达推出了创新性的Nemotron系列模型,覆盖语音处理、检索增强生成(RAG)和内容安全三大方向。

在语音交互方面,Nemotron Speech模型展现出卓越性能,在实时字幕生成与语音应用测试中较现有方案快10倍。博世公司已将其应用于车载语音系统优化,显著提升了用户体验。

同时,Nemotron Safety模型在内容安全领域实现突破,能够有效检测恶意内容并识别敏感数据。该技术已获 CrowdStrike 和 Fortinet 等网络安全公司采用,极大增强了企业级AI系统的安全性。

Cosmos与Isaac:机器人世界的智慧进化

在物理AI领域,英伟达推出Cosmos世界模型平台,赋予机器人对现实环境的深度理解和自主推理能力。这一突破性技术让机器能够像人类一样认知和适应复杂场景。

核心模型Cosmos Reason 2显著提升了机器人对物理空间的感知精度和交互效率。而Cosmos Transfer 2.5则创新地通过生成合成视频来加速AI训练进程,为机器人技术发展开辟了新路径。

基于Cosmos平台,英伟达还发布了专为人形机器人设计的Isaac GR00T N1.6模型。该模型具备全身运动控制和环境推理能力,大幅提升了人机协作的智能化水平。

目前,Franka Robotics等公司正在利用这些工具在虚拟环境中模拟测试机器人行为,随后将优化方案应用于实际场景部署。这种创新性的开发模式大大缩短了产品落地周期。

Alpamayo:自动驾驶的颠覆性突破

为解决自动驾驶领域的技术难题,英伟达首次推出了Alpamayo系列开源解决方案。其中,Alpamayo 1是首个面向自动驾驶的大规模推理VLA(视觉语言动作)模型,能够实现对周围环境的深度理解并解释驾驶决策过程。

配合全新发布的AlpaSim仿真框架,开发者可以进行闭环训练,有效应对各种极端场景挑战。此外,英伟达还开源了包含1700多小时真实驾驶数据的数据集,覆盖多样化的地理环境和复杂交通状况,为高等级自动驾驶的研发提供了宝贵资源。

Clara:医疗健康的创新引擎

在生物医学领域,英伟达推出了新一代的Clara AI模型。其中,La-Proteina模型实现了原子级别的蛋白质设计能力,为攻克复杂疾病提供了全新工具。

ReaSyn v2将制造可行性直接融入药物研发过程,确保生成化合物的实际可合成性。KERMT模型则能够在药物开发早期预测其与人体的相互作用,显著提升新药研发的安全性和效率。配合公开的45.5万个蛋白质结构数据集,这些工具为医疗健康领域的创新提供了强大的技术支撑。

CES 2026 消费电子展专题

© 版权声明

相关文章