Meta人工智能研究团队在5月14日正式推出了两项重要成果:Open Molecules 2025(OMol25)大型化学数据集及突破性的UMA通用原子间势能模型家族,为分子模拟和材料科学研究领域注入了新的活力。
作为当前规模最大的分子特性预测数据集,OMol25包含了超过1亿个三维分子结构,这些结构基于密度泛函理论(DFT)计算生成,确保了极高的物理精度。这一创新性的数据集不仅为训练高性能AI模型提供了丰富的资源,还支持语言处理和神经科学等多个研究方向。
在传统计算化学领域,DFT方法虽然精确,但其计算成本较高且耗时较长。为了克服这一挑战,Meta团队开发了基于机器学习的替代方案——机器学习原子间势(MLIPs),该技术能够在保持高精度的同时显著提升运算效率,为科学研究和工业应用提供了更高效的解决方案。
与此同时,Meta还推出了UMA通用原子间势能模型家族。这一创新的预训练模型无需微调即可直接应用于多种化学任务,涵盖分子性质预测、材料设计、催化剂开发以及能量存储等领域。UMA采用了独特的”Mixture of Linear Experts”架构,并提供两种规模选择:轻量级的UMA-small和性能强大的UMA-medium。其中,UMA-medium模型虽拥有14亿参数,但单次结构计算仅需约5000万个参数,有效提升了推理速度。
实验结果表明,UMA在多个测试基准中均展现出色性能,其预测精度与现有专用模型相当甚至更优。这一突破性进展为学术研究和工业应用开辟了新的道路,推动跨学科的技术创新,并为化学、材料科学及半导体制造等领域带来了重要机遇。
相关参考资料
-
《Open Molecules 2025(OMol25)数据集、评估与模型》
-
分享最新突破:支持分子特性预测、语言处理和神经科学的研究成果
-
计算化学的新纪元:破纪录的数据集发布——伯克利实验室新闻稿
-
UMA:通用原子间势能模型家族 | Meta AI研究
-
facebook/OMol25 · Hugging Face平台资源库
-
facebook/UMA · Hugging Face平台资源库