AI工具
TextDiffuser-2 – 微软等推出的AI图像文本渲染融合框架
TextDiffuser-2是什么Text-Diffuser2是由来自微软研究院、香港科技大学和中山大学的[…]
LayerDiffusion – AI生成具有透明度的图像的框架
LayerDiffusion是什么LayerDiffusion(现已更名为LayerDiffuse)是由来自[…]
ScreenAI – 谷歌推出的可读屏AI视觉模型,可理解UI和信息图表
ScreenAI是什么ScreenAI是一个由谷歌的研究人员推出的可读屏AI视觉语言模型,专门设计用于理解和[…]
Claude 3 – Anthropic推出的第三代大模型和AI聊天机器人
Claude3是什么Claude3是人工智能初创公司Anthropic开发的新一代人工智能模型,旨在提供[…]
DUSt3R – 从任意图像集合中重建3D场景的框架
DUSt3R是什么DUSt3R(DenseandUnconstrainedStereo3DReco[…]
UniEdit – 免训练调优的统一视频编辑框架
UniEdit是什么UniEdit是由浙江大学、微软研究院和北京大学的研究人员推出的一个创新的视频编辑框架,[…]
AtomoVideo – 阿里推出的高保真图像到视频生成框架
AtomoVideo是什么AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频(Image-[…]
ResAdapter – 字节推出的扩散模型分辨率适配器
ResAdapter是什么ResAdapter是由字节跳动的研究人员推出的一种为扩散模型(如StableD[…]
PixArt-Σ – 华为推出的可生成4K高清图像的文生图模型
PixArt-Σ是什么PixArt-Σ是由来自华为诺亚方舟实验室、大连理工大学和香港大学的研究人员推出的一个[…]
Moondream – 开源的轻量级AI视觉语言模型,可在本地快速运行
Moondream是什么Moondream是一个免费开源的小型的人工智能视觉语言模型,虽然参数量小(Moon[…]