近日,腾讯混元实验室正式发布并开源了其最新研发的3D生成模型家族——混元3D-Omni与混元3D-Part。
-
作为行业首个支持多维度控制的3D生成框架,混元3D-Omni突破了传统图像输入的限制,能够处理包括图像、点云等多种模态数据,并实现对物体几何结构、拓扑关系及姿态等关键要素的精准调控。
-
而混元3D-Part则通过创新性的组件化拆分与生成技术,使复杂的3D模型构建变得简单可控,为用户提供了一种类似“乐高式”的建模体验。
此次发布的两项技术不仅完全开源且免费使用,还提供了完整的推理代码和预训练权重,旨在推动学术研究和工业界的实际应用。
一、混元3D-Omni:多维度精准控制的3D生成
混元3D-Omni基于混元3D 2.1版本构建,通过创新设计的统一控制编码器和渐进式难度训练策略,实现了对多达四类控制条件的灵活支持:
-
骨骼控制:在单图输入条件下引入骨骼数据,可精确调节生成人物的姿态,特别适用于动画制作和虚拟角色设计。
-
点云增强:通过整合完整物体点云或从深度图提取的点云信息,有效消除单图像带来的视觉歧义,显著提升模型几何精度。
-
边界框调整:允许用户灵活微调生成模型的比例参数,确保输出结果与预期需求高度契合。
-
体素控制:通过精细的结构调节,实现对物体几何细节的精确把控。
这些控制条件不仅能够单独使用,还可以任意组合。同时支持来自深度相机、LiDAR等多种数据源输入。开发人员还可以在此基础上扩展更多创新功能,例如自定义姿态控制等。
二、混元3D-Part:组件化建模新思路
混元3D-Part通过模块化的拆分与重构技术,大大简化了复杂模型的构建流程。其核心优势在于:
-
采用创新的组件化方法,使大型场景和复杂物体的建模更加高效。
-
提供高度可定制化的拆分策略,满足不同场景的需求。
-
显著提升建模效率,降低对专业知识的要求。
目前,该技术已正式集成到腾讯混元3D Studio平台,并通过混元3D创作引擎向用户提供免费服务。
开源资源访问地址:
【混元 3D-Omni】
-
代码下载:https://github.com/Tencent-Hunyuan/Hunyuan3D-Omni
-
权重下载:https://huggingface.co/tencent/Hunyuan3D-Omni
-
技术报告:https://arxiv.org/pdf/2509.21245
【混元 3D-Part】
-
代码:https://github.com/Tencent-Hunyuan/Hunyuan3D-Part
-
权重:https://huggingface.co/tencent/Hunyuan3D-Part