智源研究院重磅发布“悟界”大模型系列,全球首发原生多模态世界模型 Emu3

AI资讯1周前发布 ainav
10 0

6月6日,北京智源人工智能研究院正式推出备受瞩目的“悟界”系列大模型家族,这一重要发布在人工智能领域引发广泛关注。该系列包括三项创新成果:全球首个原生多模态世界模型“悟界・Emu3”,全球首个脑科学多模态通用基础模型“悟界・见微 Brainμ”,以及先进的具身智能大模型体系。

此次发布的“悟界”系列中,最引人注目的是基于MCP框架的跨本体大小脑协作系统。其中包括全球领先的悟界・RoboOS 2.0操作系统、强大的具身大脑模型悟界・RoboBrain 2.0,以及开创性的全原子微观生命模型悟界・OpenComplex2。

回溯至去年10月,智源研究院就已经推出了具有里程碑意义的原生多模态世界模型Emu3。这一突破性技术仅依赖于自回归预测机制,无需借助扩散模型或复杂的组合方法,即可实现对文本、图像和视频等多模态数据的深度理解与生成能力。官方宣称,该模型成功实现了跨模态数据处理的“大一统”。

值得注意的是,“悟界・见微 Brainμ”基于Emu3的核心架构,将先进的神经科学信号(如fMRI、EEG、双光子等)进行统一token化处理。借助预训练模型的多模态对齐优势,该系统能够实现脑信号与文本、图像等多种模态数据之间的双向映射,完成跨任务、跨模态和跨个体的通用建模,并以单一模型支持多种神经科学研究任务。

智源研究院重磅发布“悟界”大模型系列,全球首发原生多模态世界模型 Emu3

▲ Emu3 生成的图像

相关阅读:

  • 《智源发布原生多模态世界模型 Emu3,宣称实现图像、文本、视频大一统》

© 版权声明

相关文章