MOVA与创智学院携手模思智能联合开源端到端音视频模型

AI工具6个月前发布 ainav

115 0 0

MOVA是什么

MOVA（全称：MOSS Video and Audio）是由上海创智学院OpenMOSS团队与模思智能(MOSI)联合开发的中国首个高性能开源端到端音视频生成模型。该模型突破了传统视频“静音”的限制，通过创新性的异构双塔架构和双向桥接模块设计，实现了原生的跨模态交互能力。作为一款具有320亿参数量（采用MoE架构，推理时激活180亿）的先进模型，MOVA能够同时生成最长8秒、720p分辨率的音视频内容，并在电影级口型同步和环境音效匹配方面达到了行业领先水平。

MOVA与创智学院携手模思智能联合开源端到端音视频模型

MOVA的主要功能

端到端音视频生成： MOVA采用一体化生成技术，能够同时输出高质量的视频和音频内容，彻底告别传统“哑巴视频”。这种创新的生成方式不仅提升了内容的表现力，还为用户带来了更自然流畅的使用体验。

MOVA的核心优势在于其强大的跨模态交互能力。通过先进的异构双塔架构和双向桥接模块设计，模型实现了视觉与听觉信息的深度融合。这种设计使得生成的内容在口型同步、环境音效等方面达到了电影级水准，显著提升了用户的沉浸感。

此外，MOVA采用了高效的MoE（混合专家）架构，在保证生成效果的同时大幅降低了计算资源的需求。这一特点使其在实际应用中更具灵活性和可扩展性，能够支持更多场景的落地。

总之，MOVA不仅仅是一个音视频生成工具，更代表了中国在人工智能领域的一项重要技术突破。它的推出不仅填补了国内相关领域的空白，也为全球AI技术的发展贡献了新的思路和方向。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

时尚-VDM – 谷歌与华盛顿大学共同开发的虚拟换衣技术

ainav

503 0

阿里通义开源的多 Agent 开发框架——AgentScope 1.0

ainav

182 0

TokenPony AI大模型资源平台：便捷接入自由调用

ainav

262 0

MindOmni：腾讯携手清华打造的多模态大语言模型

ainav

177 0

代码伴侣——拥有AI内置IDE功能的智能编程辅助工具

ainav

604 0

AI职场社交工具：高效连接职业伙伴

ainav

191 0

一站式AI工具导航平台！汇聚超800+免费AI工具，涵盖AI写作、智能绘画、论文生成、视频制作、编程辅助、音频处理等全场景工具。每日更新热门 AIGC工具（如 Sora、AI Agent），助您快速找到提升办公、创作、学习效率的实用工具！立即访问ai-nav.net，探索 AI 新可能！

按下Ctrl+D或⌘+D 感谢收藏 ai-nav.net

友链申请免责声明广告合作关于我们站点地图提交AI工具

 度加创作工具百度AI开放平台 Bing新必应搜外友链 Manus GPTBots.ai Claude Code

Copyright © 2026 AI工具导航站粤ICP备2025438650号-2