4月23日,Character.AI公司宣布推出革命性AI模型AvatarFX。
这一创新技术使静态图片中的人物能够开口”说话”。用户只需上传一张照片并选择一个声音,就能生成可以动作、表达情感的动态形象。
据公司介绍,这一技术的核心是名为”SOTA DiT-based diffusion video generation model”的先进AI模型。该模型通过深度学习训练,并整合了音频条件优化技术,实现了高效、高质量的视频生成。
AvatarFX的技术优势在于其出色的高保真度和时间一致性。即使面对多角色、长对话等复杂场景,也能保持快速生成和稳定运行。与OpenAI的Sora及Google的Veo等其他技术不同,AvatarFX专注于将特定图片转化为动态影像。
这项创新技术为用户带来全新体验的同时,也引发了一些值得关注的问题。用户可能利用该技术制作名人或熟人形象的虚假视频,这不仅涉及隐私问题,还可能引发更广泛的伦理争议。
© 版权声明
文章版权归作者所有,未经允许请勿转载。