腾讯混元3D开源:面向游戏建模与3D打印的应用探索

AI资讯2个月前发布 ainav
48 0

近日,腾讯混元实验室正式发布并开源了其最新研发的3D生成模型家族——混元3D-Omni与混元3D-Part

  • 作为行业首个支持多维度控制的3D生成框架,混元3D-Omni突破了传统图像输入的限制,能够处理包括图像、点云等多种模态数据,并实现对物体几何结构、拓扑关系及姿态等关键要素的精准调控。

  • 混元3D-Part则通过创新性的组件化拆分与生成技术,使复杂的3D模型构建变得简单可控,为用户提供了一种类似“乐高式”的建模体验。

此次发布的两项技术不仅完全开源且免费使用,还提供了完整的推理代码和预训练权重,旨在推动学术研究和工业界的实际应用。

一、混元3D-Omni:多维度精准控制的3D生成

混元3D-Omni基于混元3D 2.1版本构建,通过创新设计的统一控制编码器和渐进式难度训练策略,实现了对多达四类控制条件的灵活支持:

  • 骨骼控制:在单图输入条件下引入骨骼数据,可精确调节生成人物的姿态,特别适用于动画制作和虚拟角色设计。

  • 点云增强:通过整合完整物体点云或从深度图提取的点云信息,有效消除单图像带来的视觉歧义,显著提升模型几何精度。

  • 边界框调整:允许用户灵活微调生成模型的比例参数,确保输出结果与预期需求高度契合。

  • 体素控制:通过精细的结构调节,实现对物体几何细节的精确把控。

腾讯混元3D开源:面向游戏建模与3D打印的应用探索

▲ 骨骼控制人物姿态

腾讯混元3D开源:面向游戏建模与3D打印的应用探索

▲ 点云控制补充三维信息

腾讯混元3D开源:面向游戏建模与3D打印的应用探索

▲ 边界框控制不同比例

腾讯混元3D开源:面向游戏建模与3D打印的应用探索

▲ 边界框控制解决单图生成“纸片”问题

腾讯混元3D开源:面向游戏建模与3D打印的应用探索

▲ 体素控制物体结构

这些控制条件不仅能够单独使用,还可以任意组合。同时支持来自深度相机、LiDAR等多种数据源输入。开发人员还可以在此基础上扩展更多创新功能,例如自定义姿态控制等。

二、混元3D-Part:组件化建模新思路

混元3D-Part通过模块化的拆分与重构技术,大大简化了复杂模型的构建流程。其核心优势在于:

  • 采用创新的组件化方法,使大型场景和复杂物体的建模更加高效。

  • 提供高度可定制化的拆分策略,满足不同场景的需求。

  • 显著提升建模效率,降低对专业知识的要求。

目前,该技术已正式集成到腾讯混元3D Studio平台,并通过混元3D创作引擎向用户提供免费服务。

开源资源访问地址:

【混元 3D-Omni】

  • 代码下载:https://github.com/Tencent-Hunyuan/Hunyuan3D-Omni

  • 权重下载:https://huggingface.co/tencent/Hunyuan3D-Omni

  • 技术报告:https://arxiv.org/pdf/2509.21245

【混元 3D-Part】

  • 代码:https://github.com/Tencent-Hunyuan/Hunyuan3D-Part

  • 权重:https://huggingface.co/tencent/Hunyuan3D-Part

© 版权声明

相关文章