11月12日,人工智能领域的权威人物李飞飞与团队共同创立的World Labs公司正式发布了其首款商业化产品——Marble世界模型工具。这一创新工具现已开放免费增值和付费订阅服务,支持用户通过文本提示、照片、视频、3D布局图或全景图等输入形式,生成可编辑、可下载的高精度三维环境。
这款产品的推出标志着World Labs在隐身模式结束后仅一年多时间便实现了重大突破。当前市场上,竞争对手Decart和Odyssey仍停留在免费试用版本,而谷歌的Genie项目也尚未完全开放。
Marble的核心优势在于其”持久化生成”功能:用户可以下载完整的3D环境文件,而不是像实时模型RTFM或其他产品那样依赖动态生成。这种设计不仅减少了场景变形和不一致的风险,还支持将生成内容输出为高斯泼溅、网格或视频格式。
作为行业首款内置AI编辑工具的三维建模系统,Marble配备了独特的混合式3D编辑器:用户可以先手动定义空间结构(如墙体、体块或平面),然后利用AI填充细节。这种创新的工作流程使创作更加灵活高效。
2023年12月,World Labs首次展示了其早期模型仅凭单张图像生成交互式三维场景的能力。尽管当时的效果令人惊叹,但受限于卡通化的视觉风格和局部渲染问题,无法实现完全自由的漫游体验。
Beta版本凭借图像提示即可生成高质量的虚拟环境,在游戏场景和真实空间复刻方面表现优异。虽然早期版本存在边缘形变等问题,但据称这些问题在正式版中已得到显著优化。
为了赋予用户更大的创作自由,Marble在输入方式上进行了重要改进:Beta版本仅支持单张图像输入,而正式版现已全面支持多角度图片和视频片段作为输入源。
“创意主导权”是Marble设计哲学的核心。开发团队认为,生成工具应该让用户能够在创作过程中保持高度控制,而不是完全依赖AI的自动化输出。
World Labs还推出了实验性3D编辑器Chisel:用户可以通过直接拖拽操作来定义空间布局,同时结合文本提示控制视觉风格。这种”结构与风格分离”的理念,类似于HTML和CSS的工作方式。
另一个重要的创新功能是世界扩展(World Expansion):当用户移动到场景边缘时,可以指令系统自动扩展当前视图并填充细节。这种方式让用户能够轻松构建超大规模的虚拟空间。
合成器模式(Composer Mode)则是针对需要处理复杂场景的专业用户设计的:它允许用户将多个独立生成的世界无缝拼接在一起,从而实现更复杂的创作需求。
在定价策略方面,Marble提供了四档订阅方案:
-
免费版:提供4次生成机会(支持文本、图片或全景图输入);
-
标准版(20美元/月):包含12次生成,支持多图和视频输入,并开放高级编辑功能;
-
专业版(35美元/月):提供25次生成机会,支持场景扩展并授予商业使用权;
-
旗舰版(95美元/月):包含75次生成机会,解锁所有功能。
尽管游戏行业对生成式AI持谨慎态度,但Marble的目标市场仍集中在游戏开发、影视视效和虚拟现实领域。
Johnson强调,Marble并非要取代传统游戏引擎,而是作为资产生成工具集成到现有管线中。它可以帮助开发者快速生成背景环境,然后在Unity或Unreal Engine等主流引擎中添加交互逻辑和其他功能。
在影视视效领域,Marble的优势在于解决了当前AI视频生成器普遍存在的镜头控制和帧间一致性问题。其输出的3D资产可以为艺术家提供更高的创作自由度。
尽管VR不是当前的重点发展方向,但Marble已经全面兼容Apple Vision Pro和Meta Quest 3等主流头显设备,所有生成的世界都可以无缝进入虚拟现实环境。
此外,在机器人领域,Marble也有潜在的应用价值。由于该领域缺乏大规模训练数据,像Marble这样的生成器可以帮助快速构建仿真训练环境。
李飞飞在近期发布的《世界模型宣言》中指出:Marble的发布标志着向”真正具备空间智能的世界模型”迈出的关键一步。她相信,下一代世界模型将使机器在空间理解能力上实现质的飞跃。
正如她在宣言结尾所言:”没有空间智能,我们对智能机器的终极愿景就永远无法实现。”