TrajectoryCrafter：腾讯港中大联合推出单目视频自由运镜技术

103 0 0

TrajectoryCrafter是什么

TrajectoryCrafter是由腾讯PCG ARC实验室与香港中文大学联合推出的一项创新技术，专注于单目视频的相机轨迹重定向领域。该技术能够实现对视频中相机位置和角度的后期自由调整，让用户可以轻松改变视频中的运镜方式。通过结合解耦视图变换和内容生成的技术，TrajectoryCrafter利用双流条件视频扩散模型，并引入点云渲染和源视频作为关键条件，实现了对用户指定相机轨迹的精准控制以及高质量4D内容生成。

TrajectoryCrafter采用创新性的双重重投影策略，并结合动态单目视频与静态多视角数据构建混合数据集进行模型训练。这种独特的训练方法显著提升了模型在多样化场景中的泛化能力，使其能够适应各种复杂的实际应用环境。在多个权威测试数据集上，TrajectoryCrafter均表现出色，生成的新型轨迹视频不仅高度逼真，还与原始视频保持了极高的内容一致性，为沉浸式视频体验开辟了新的可能。

TrajectoryCrafter的主要功能

精准轨迹控制： 用户可以根据需求自由指定任意相机轨迹（如平移、旋转、缩放等），系统将生成与之匹配的高质量视频内容。
高保真视频生成： 生成的视频在视觉效果上与原始视频高度一致，细节和纹理表现都非常出色。
4D空间一致性： 生成的内容不仅在空间布局上严格遵循目标轨迹，在时间维度上也保持了与原视频的一致性，彻底避免内容漂移或闪烁等问题。
场景适应性强： 模型经过精心设计和训练，能够有效应对各种复杂场景（如室内、室外、动态场景等），展现出极强的泛化能力。

TrajectoryCrafter的技术原理

双流条件视频扩散模型：
- 视图变换与内容生成解耦： 通过将相机轨迹的确定性变换过程与内容生成的随机化过程分离处理，TrajectoryCrafter实现了对视图变换的精确控制。借助点云渲染技术，系统能够准确捕捉视频中的几何关系，并基于扩散模型生成高质量的内容。
- 双流条件机制： 系统同时利用点云渲染和源视频作为关键输入条件，构建了高效的双流处理机制。这种设计使得模型能够更充分地提取和融合多模态信息，显著提升了生成内容的质量和真实性。
创新的重投影策略： 通过引入动态单目视频与静态多视角数据的混合训练方法，TrajectoryCrafter实现了对复杂场景的高效建模。这种独特的训练方案不仅提高了模型的泛化能力，还显著增强了其在实际应用中的表现效果。