AI工具
智谱研发的电脑智能体GLM-PC —— 采用CogAgent视觉多模态模型创建
GLM-PC代表的是什么? GLM-PC是由智谱AI基于CogAgent视觉多模态模型构建的一款通用智能代理程序。它能够模仿人类操作电脑的行为,并在“无人驾驶”模式下自主控...
谷歌与马里兰大学等机构合作研发的视频拆分技术——生成性Omnimatte
生成式全景观是关于什么的讨论? Google DeepMind 等机构开发的 Generative Omnimatte 是一种先进的视频编辑技术,它能够自动将视频内容分解成多个带有透明背...
体验AI换装科技 – 通过一张人物照片创建标准服饰影像
探索OffDiff意味着什么 VTOFF(即TryOffDiff)是一种创新的虚拟试穿技术,依托扩散模型实现了高度逼真的服装重构与虚拟试衣体验。该技术特别注重从单张人物照...
智谱公开发布的GLM-Edge – 面向终端的大语言及多模态模型系列
GLM-Edge代表的是什么? GLM-Edge是由智谱开放的一组专门用于终端设备优化部署的大型语言交流模型及多模式解析模型,其中包括基于GLM架构的边缘聊天模型1.5B...
FlagEvalMM – 智源开放的多模式评估框架
FlagEvalMM指的是什么? FlagEvalMM是由北京智源人工智能研究院开放的一款多模态评估框架,专为全面检验处理文本、图像及视频等不同数据类型的模型而设计,并...
Lamucal – 利用AI技术的音乐创作平台,即时创建任何歌曲的伴奏、六线谱、词曲及旋律
Lamucal指的是什么 Lamucal是一款由人工智能驱动的音乐创意软件,能够即时创建任意歌曲的和弦配置、吉他谱式、歌词及旋律线。它具备交互式的学习功能,允许用...
Kombai —— 利用AI技术从设计稿自动生成优质HTML、CSS及React组件的工具
Kombai指的是什么? Kombai是一款专门面向设计师与开发者的人工智能代码生成工具,旨在简化从Figma界面设计到前端编程语言转换的过程。通过运用深度学习技术...
Agent-E – 利用AutoGen代理架构打造的AI驱动浏览器自动化工具
Agent-E指的是什么? Agent-E是一款利用AutoGen代理框架打造的智能化自动处理系统,主要致力于浏览器内部的操作自动化。该系统以自然语言交流为基础,能够完...
Delta-CoMe – 由清华携手 OpenBMB 及其他高校共同开发的新一代开源增量压缩技术
Delta-CoMe代表的是一个特定的概念或项目,具体含义需要根据上下文来确定。这里假设它是某个技术、模型或者计划的名称,在不改变其本质的前提下进行表述变换...
不适宜内容识别器 – 一款开源的AI工具,能够检测图像、PDF和视频中的敏感信息
NSFW Detector指的是用于识别非适宜工作环境内容的工具或系统。 不适合工作环境内容检测器(缩写为NSFW)是一款公开源代码的软件,用于辨识图片、PDF文档和视...