AI工具

ChatTTS – 开源的用于对话的生成式语音合成模型
ChatTTS是什么ChatTTS是一款专为对话场景设计的支持中英文的文本转语音(TTS)模型,基于约10万[…]
Seed-TTS – 字节跳动推出的高质量文本到语音生成模型
Seed-TTS是什么Seed-TTS是由字节跳动开发的高级文本到语音(TexttoSpeech,TTS[…]
Qwen2 – 阿里云开源的新一代通义千问大模型
Qwen2是什么Qwen2是由阿里云通义千问团队开源的新一代大语言模型,该系列涵盖了从0.5B到72B不等的[…]
Follow-Your-Emoji – 腾讯等推出的基于扩散模型的人像动画框架
Follow-Your-Emoji是什么Follow-Your-Emoji是由香港科技大学、腾讯混元和清华大[…]
ToonCrafter – 腾讯等开源的卡通动画视频插帧工具
ToonCrafter是什么ToonCrafter是由腾讯AI实验室、香港中文大学和香港城市大学的研究人员开[…]
MimicBrush – 阿里等开源的AI图像编辑融合框架
MimicBrush是什么MimicBrush是由阿里巴巴、香港大学和蚂蚁集团的研究人员推出的AI图像编辑融[…]
Stability AI开源Stable Diffusion 3 Medium文生图模型
6月12日晚间消息,人工智能初创公司StabilityAI宣布正式开源发布其最新的文本到图像生成模型——St[…]
国家网信办发布第六批深度合成服务算法备案信息,腾讯混元等492个算法在列
6月12日消息,国家网信办今日发布公告,根据《互联网信息服务深度合成管理规定》,现公开发布第六批境内深度合成服[…]
Unique3D – 清华大学团队开源的图像到3D生成模型
Unique3D是什么Unique3D是清华大学团队开源的一个单张图像到3D模型转换的框架,通过结合多视图扩[…]
谷歌DeepMind推出V2A技术,可为无声视频添加逼真音效
在人工智能领域,谷歌旗下的DeepMind公司再次取得突破性进展,推出了一款名为V2A(Video-to-Au[…]
1 22 23 24 25 26 251