GaussianAnything:3D生成框架,由新加坡南洋理工S-Lab、上海AI Lab等联合推出

AI工具7天前发布 ainav
19 0

GaussianAnything是什么

作为一种创新的3D生成框架,GaussianAnything由南洋理工大学S-Lab与上海AI实验室等机构联合开发。该技术基于点云结构化潜在空间和级联流匹配模型,实现了高质量、高扩展性的三维内容生成能力。GaussianAnything支持多模态条件输入,包括点云数据、文本描述以及单/多视角图像,并能够生成具有几何与纹理分离特性的3D资产,为后续编辑提供了极大便利。在多种基于文本和图像的三维生成任务中,GaussianAnything均展现出超越现有方法的表现,特别是在三维一致性和生成质量方面优势显著。

GaussianAnything

GaussianAnything的主要功能

  • 多模态输入支持:兼容多种输入形式,包括点云数据、文本描述以及单/多视角图像。
  • 高质量3D生成:可输出细节丰富且表面质量高的三维模型,同时支持不同分辨率和细节层次的定制化输出。
  • 高效的编辑能力:提供灵活的三维模型编辑功能,如形状调整、纹理替换等操作。
  • 多格式输出:生成的3D模型可导出为点云、高斯表面(Surfel Gaussian)或三角网格(Mesh)等多种格式,满足不同应用场景的需求。

GaussianAnything的技术原理

  • 3D VAE编码器:以多视图的RGB-D图像和法线数据作为输入,利用基于3D注意力机制的Transformer编码器将三维物体压缩至点云结构化的潜在空间中。这种设计不仅保留了丰富的几何和纹理信息,还显著降低了潜空间维度,提升了训练效率。
  • 点云结构化潜在空间:通过Cross Attention机制将特征投影到稀疏的3D点云上,形成结构化的潜在变量表示,从而有效保留三维物体的几何特性,并为高效的3D扩散模型训练提供支持。
  • 级联扩散模型
    • 第一阶段:生成稀疏点云,确定三维物体的整体几何布局。
    • 第二阶段:基于生成的点云条件,进一步细化纹理细节,实现几何与纹理的有效解耦。
  • 高质量解码器:结合3D Transformer和上采样模块,将点云潜在表示逐步转换为高分辨率的三维模型。

项目地址

GaussianAnything的相关资源可通过以下链接获取:
官方网站
GitHub仓库

应用场景

  • 游戏和影视特效:用于快速生成高质量的三维角色和场景模型。
  • 虚拟现实与增强现实:为VR/AR应用提供丰富的三维内容支持。
  • 产品设计:助力工业设计中的快速原型制作和优化。
  • 机器人视觉:生成大量高质量的三维数据用于训练深度学习模型。
© 版权声明

相关文章