蚂蚁集团开源的大语言模型 LLaDA 2.0

AI工具7个月前发布 ainav

234 0 0

LLaDA 2.0是什么

LLaDA 2.0是由蚂蚁集团全新发布的开源离散扩散大语言模型（dLLM），该模型提供了16B（mini）和100B（flash）两个版本，分别对应不同的参数规模。作为一项具有里程碑意义的创新成果，LLaDA 2.0成功突破了传统扩散模型在规模扩展上的局限性，首次将模型参数量提升至100B级别。

通过引入革命性的Warmup-Stable-Decay（WSD）持续预训练策略，LLaDA 2.0实现了从自回归模型到扩散模型的无缝转换。这一突破使得模型能够继承自回归模型的知识体系，同时避免了传统方法中需要从头开始训练所带来的高昂成本。

蚂蚁集团开源的大语言模型 LLaDA 2.0

LLaDA 2.0的主要特性

突破性规模扩展：LLaDA 2.0提供两种版本，其中100B参数量的版本达到了当前同类扩散模型中的最高水平。这一成就标志着扩散模型在实际应用中的可用性和效率实现了质的飞跃。
创新预训练策略：独特的WSD预训练方法为模型注入了强大的自适应能力，使其能够更高效地学习和生成高质量文本，同时显著降低了训练成本。
性能优化：LLaDA 2.0在保持扩散模型核心优势的同时，通过优化设计大大提升了生成效率和效果，特别是在处理复杂任务时表现优异。

LLaDA 2.0的发布不仅为学术界提供了新的研究方向，更为产业界的实际应用展示了广阔前景。其创新性技术和突破性的参数规模将为AI领域带来深远影响。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

SAM：Meta开源视觉分割模型

ainav

174 0

小红书推出全新FireRedChat双向通话功能

ainav

228 0

探索Claude——一款由17岁高中小发明家创造的顶级提示工具，让人工智能思维更加贴近人类

ainav

334 0

PreenCut：开源AI视频剪辑软件，支持自然语言检索

ainav

322 0

GLM-4.6震撼发布：智谱最强编码神器！

ainav

211 0

白瓜求职 —— 线上智能面试伴侣，迅速构建面试回答

ainav

742 0

一站式AI工具导航平台！汇聚超800+免费AI工具，涵盖AI写作、智能绘画、论文生成、视频制作、编程辅助、音频处理等全场景工具。每日更新热门 AIGC工具（如 Sora、AI Agent），助您快速找到提升办公、创作、学习效率的实用工具！立即访问ai-nav.net，探索 AI 新可能！

按下Ctrl+D或⌘+D 感谢收藏 ai-nav.net

友链申请免责声明广告合作关于我们站点地图提交AI工具

 度加创作工具百度AI开放平台 Bing新必应搜外友链 Manus GPTBots.ai Claude Code

Copyright © 2026 AI工具导航站粤ICP备2025438650号-2