8月15日,腾讯官方宣布,其混元团队正式推出 Lite 版本的3D世界模型。通过引入创新性的动态 FP8 量化技术,该版本将原本需要26GB显存的模型优化至17GB以下,首次实现了在消费级显卡上的流畅运行。
Lite版本的核心突破在于其量化技术的深度优化。通过将Transformer中的Q、K、V矩阵量化为INT8,并结合动态平滑与硬件加速,混元团队实现了推理速度提升3倍以上,同时保持了99%以上的精度。这一技术创新显著降低了模型运行所需的显存资源。
除了显存优化,混元团队还集成了先进的Cache算法。该算法通过识别关键时间步和block,优化冗余计算,显著提升了推理效率。经过改进后,模型运行更加流畅稳定。
作为首个开源的可编辑3D世界生成模型,腾讯混元3D世界模型1.0凭借其强大的场景生成能力和高质量输出,在发布之初便受到广泛关注。然而,显存需求过高一直是限制其应用的主要瓶颈。
混元3D世界模型的独特优势在于其多维度的创新:支持文字和图片输入,实现可交互、可编辑的360度漫游场景生成;通过层次化3D重建技术,生成高质量且高度真实的虚拟场景。更重要的是,生成的内容可以无缝导出为3D mesh格式,直接用于游戏开发、影视制作或物理仿真等专业领域。
尽管模型具备强大的功能,但其26GB以上的显存需求让大多数消费级设备望而却步。这成为用户体验中的主要障碍。
为了解决这一问题,混元团队倾力打造了Lite版本,使该模型能够运行在主流的消费级显卡上,从而降低了使用门槛,让更多开发者和企业得以受益。
以下是混元世界模型1.0-Lite在消费级显卡上的运行效果展示:
官方资源地址:
-
官网:https://3d.hunyuan.tencent.com/sceneTo3D
-
GitHub项目:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0
-
Hugging Face模型:https://huggingface.co/tencent/HunyuanWorld-1
-
技术报告:https://arxiv.org/abs/2507.21809