AI工具
DiT – 基于Transfomer架构的扩散模型
DiT是什么DiT(DiffusionTransformers)是一种新型的扩散模型,由WilliamP[…]
Stable Diffusion 3 – Stability AI推出的新一代图像生成模型
StableDiffusion3是什么StableDiffusion3是由StabilityA[…]
SDXL-Lightning – 字节跳动推出的文本到图像生成模型
SDXL-Lightning是什么SDXL-Lightning是由字节跳动的研究团队推出的一种基于扩散模型的[…]
ConsiStory – 免训练实现主题一致性的文生图方法
ConsiStory是什么ConsiStory是由NVIDIA和特拉维夫大学的研究人员共同开发的一种无需训练[…]
ScreenAgent – 基于视觉语言模型的计算机控制智能体
ScreenAgent是什么ScreenAgent是一个由吉林大学人工智能学院的研究团队开发的计算机控制智能[…]
GPT-SoVITS – 开源的声音克隆项目,只需少量数据即可合成声音
GPT-SoVITS是什么GPT-SoVITS是一个开源的声音克隆项目,由B站UP主、RVC变声器创始人花儿[…]
YOLOv9 – 新一代高效的实时目标检测系统
YOLOv9是什么YOLOv9是一个由台北中研院和台北科技大学等机构的研究团队推出的新一代先进的目标检测系统[…]
Mistral Large – Mistral AI发布的一款先进的大语言模型
MistralLarge是什么MistralLarge是由法国人工智能公司MistralAI开发的一款[…]
EMO – 阿里推出的AI肖像视频生成框架
EMO是什么EMO(EmotePortraitAlive)是一个由阿里巴巴集团智能计算研究院的研究人员开[…]
ChatMusician – 可理解和生成音乐的大模型
ChatMusician是什么ChatMusician是由MultimodalArtProjection[…]