全球首个统一多模态视频模型——快手可灵视频O1模型全量上线

AI资讯2个月前发布 ainav
69 0

重磅发布!12月1日,可灵AI官方宣布全球首个统一多模态视频模型——可灵O1正式全量上线。

据官方介绍,可灵O1模型采用了全新的生成式技术底座,彻底打破了传统AI功能模块割裂的限制。其创新性地引入了多模态视觉语言(MVL)交互架构,在单一输入框中实现了多种任务的无缝融合。通过先进的Chain-of-thought技术,该模型展现了强大的常识推理与事件推演能力。

官方强调,凭借统一模型的强大语义理解能力,“每一个画面、每一段视频在可灵O1眼中都能转化为精准的指令”。此次同步上线的全新创作界面更是大幅降低了使用门槛,用户只需通过简单的对话交互,即可灵活调用各类素材,实现细节的精确控制。

值得注意的是,可灵O1支持多视角主体构建,无论镜头如何切换,主体特征始终保持一致,确保画面连贯性和精准度。同时,用户还可以自由组合多个主体,为视频创作提供了更大的想象空间。

全球首个统一多模态视频模型——快手可灵视频O1模型全量上线

全球首个统一多模态视频模型——快手可灵视频O1模型全量上线

全球首个统一多模态视频模型——快手可灵视频O1模型全量上线

参考链接:

  • 体验链接

© 版权声明

相关文章