AI工具

Diff-Instruct —— 一种通用的知识转移框架来自预训练的扩散模型

Diff-Instruct指的是什么 Diff-Instruct是一种先进的知识迁移技术,旨在从预训练扩散模型中提取信息,并用于引导其他生成模型的学习过程。其核心在于引入了一...

VidTok —— 由微软开放源代码的视频分割工具,兼容连续与离散式分割功能

VidTok指的是什么? Video Tokenizer(简称VidTok)是微软推出的一款先进的开源视频分词工具,它运用高效的算法将视频内容解析成一系列“视频词条”。该工具能...

MyTeachers.ai —— 以AI教师辅助的学习解决方案,助力家长与学生成就学业成功

MyTeachers.ai是指什么 MyTeachers.ai是一款专为8岁以上学生设计的AI辅导工具,提供全面的家庭学业支持服务。该平台集成了多项功能,包括智能古诗文学习、打...

窥视AI风尚——上传个人照打造虚拟形象,尝试多样服装搭配

Loogie指的是什么 Lookie是一款基于AI技术的服装搭配应用,允许用户上传个人照片以生成数字形象,并尝试多种流行的服饰选择。它提供超过25种风格多样的衣物供...

新一代编码器模型 ModernBERT —— 由英伟达与Hugging Face等组织共同开放源代码推出

什么是ModernBERT? 由Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达与HuggingFace共同研发的ModernBERT是一款先进的编码器-only Transformer架构模型,...

无限视界 —— 字节跳动研发的超高清晰度图片创造工具

什么是无限大? 字节跳动发布了名为Infinity的视觉生成系统,该系统采用位级自回归建模技术,能够依据文字指令创作出高分辨率和极具真实感的画面。通过利用无...

钴蓝 – 跨平台的开源流媒体抓取软件,适用于各类视频、音乐及图像内容的获取

cobalt指的是什么? Cobalt是一款开源流媒体下载软件,旨在为用户提供无广告、界面简洁清爽的体验。它兼容各大主流视频网站、社交平台及音乐站点上的音频与视...

智谱AI开放的GLM-PC基础模型——CogAgent-9B

CogAgent-9B指的是什么 CogAgent-9B是一款专为代理任务设计的模型,其基础是GLM-4V-9B,并且仅使用屏幕截图作为输入信息,不依赖HTML或其他文本描述。该模型...

提升视频品质的算法 —— Enhance-A-Video,由上海AI实验室与新加坡国立大学等机构共同研发

增强视频(Enhance-A-Video)是指什么 Enhance-A-Video 是由新加坡国立大学、上海人工智能实验室及德克萨斯大学奥斯汀分校共同研发的一款用于提升视频生成效...

香港大學與Salesforce合作推出AGUVIS —— 一個全新的統一視覺化GUI自動化架構

AGUVIS代表的是什么? AGUVIS是由香港大学与Salesforce共同开发的一个统一纯粹的视觉架构,专用于自主图形用户界面智能体的操作,在多个平台(包括网页、桌面...
1 309 310 311 312 313 347