AI工具
阿里通义发布的依托于DiTs技术的上下文LoRA图像创建架构
In-Context LoRA指的是什么? In-Context LoRA是由阿里巴巴通义实验室开发的一种基于扩散变换器(DiTs)的技术框架,旨在通过利用模型内部上下文学习的能力来...
梦想视界 —— 创造泛用型世界观的视频制作工具,支持生产时长超一分钟的影片
WorldDreamer指的是什么 WorldVisionary是一款基于Transformer架构的通用型世界模型,专注于解析与预测物理世界的变动及动态法则,并提升了其生成视频的质量...
梅子AI学术文章 – 利用人工智能技术自动构建千字论文提纲
梅子AI论文指的是什么? 梅子AI作文是一款专门针对学术撰写的智能辅助软件,其设计目的是协助使用者迅速创作出高质量的研究文章。该工具能够快速自动生成研究...
英伟达发布创新图像编辑技术:无须训练的Add-it
Add-it指的是什么 NVIDIA开发了无需训练的图像编辑技术Add-it,该技术能够依据文本指令向图片内添加物体。其工作原理基于扩展扩散模型中的注意力机制,通过结...
智谱AI、清华大学与北京大学合力打造的文本至3D创建模型——DreamPolish
DreamPolish指的是什么 DreamPolish是由智谱AI、清华大学及北京大学联合开发的文本转三维模型生成系统,采用了两阶段策略以优化复杂物体的精细结构与高品质材...
阿里与港大等多个机构共同打造的AI基本环境仿真系统 —— The Matrix
《矩阵》指的是什么 《矩阵》是一款与电影同名的AI基础虚拟现实模拟器,由一个完全由中国人才组成的团队开发(成员分别来自阿里巴巴、香港大学、滑铁卢大学以...
IDEA研究院发布通用视觉大模型 DINO-X
DINO-X指的是什么 IDEA研究院近期发布了一款名为DINO-X的通用视觉大模型,该模型能够对开放世界中的对象进行检测和理解。它兼容文本输入、图像分析以及个性化...
DynaMem – 来自纽约大学与Hello Robot的动态空间认知存储方案
DynaMem指的是什么? 由纽约大学和Hello Robot联合开发的DynaMem是一款面向移动操作设计的开放式世界动态空间语义记忆系统。该系统通过维护一个特征点云作为...
华为诺亚方舟与香港科技大学合作发布的图像合成架构OmniBooth
OmniBooth指的是什么 华为诺亚方舟实验室与香港科技大学的研究团队联手开发了名为OmniBooth的图像生成框架。该框架能够根据用户的文字描述或图片参考来精确调...
腾讯PCG与多家高校联手打造的3D纹理创建平台MVPaint
MVPaint指的是什么? MVPaint是由腾讯PCG、上海AI LAB、南洋理工大学S-Lab和清华大学联合开发的一款三维纹理创建框架,利用同步多视角扩散技术实现高质量且无...