AI工具
港大联合Adobe推出全新图像编辑模型ObjectMover
什么是ObjectMover? ObjectMover是由香港大学和Adobe Research联合开发的一种创新图像编辑模型,旨在解决在移动、插入或删除图像中的物体时常见的光照不协调...
PhysGen3D:由清华大学等高校联合推出的基于单图的交互式三维场景生成工具
PhysGen3D是什么 PhysGen3D 是一个创新性的 3D 框架,能够将单张静态图像转换为可交互的动态 3D 场景,并生成具有物理真实感的视频内容。该系统结合了基于图...
EmotiVoice:网易有道开源AI语音合成系统
EmotiVoice是什么 EmotiVoice是由网易有道公司开源的一款先进的多语言、多音色文本到语音(TTS)合成系统。该系统不仅支持中英文双语转换,还提供了超过2000...
AI 3D建模神器:手绘草图秒变三维模型
Vibe Draw是什么 作为一款开源的AI 3D建模工具,Vibe Draw凭借其强大的功能和便捷的操作流程,正在迅速成为创意设计领域的热门选择。它能够将简单的2D涂鸦转...
OmniSQL:开源文本转SQL查询工具
OmniSQL概述 OmniSQL 是一个开源的文本到 SQL 转换模型,能够将自然语言问题高效地转换为精确的 SQL 查询语句。该系统通过创新性的数据合成框架构建了首个百...
AI动作捕捉工具:2D视频转换为3D运动数据
Move AI是什么 Move AI是一款革命性的AI动作捕捉工具,它采用了先进的无标记动作捕捉技术,结合人工智能和计算机视觉领域的前沿成果,能够将普通摄像头(包括...
MegaTTS 3——字节跳动与浙江大学联合开发的零样本语音合成系统
MegaTTS 3是什么 由字节跳动与浙江大学联合开发的MegaTTS 3是一款先进的零样本文本到语音合成系统。该系统采用轻量级扩散模型架构,仅需0.45B的参数量即可实...
智谱推出首个免费深度研究与操作AI Agent
什么是AutoGLM沉思? AutoGLM沉思是由中国人工智能公司智谱推出的全新一代AI智能体(AI Agent),它是一款完全免费、具有深度分析能力的智能化工具。该产品能够...
面壁智能cpmGO:纯端侧汽车智能助手的首款发布
什么是cpmGO? cpmGO(小钢炮超级助手)是由面壁智能开发的全球首款专注于汽车座舱领域的端侧智能助手,专为提升车内交互体验而设计。它基于创新的MiniCPM端侧...
AI智能助手:浏览器插件,高效辅助网页内容的理解、分析与处理
Elmo Chat是什么 Elmo Chat是由Lepton AI开发的一款Chrome浏览器扩展工具,它利用先进的人工智能技术来简化用户对各种内容的理解与处理流程。该工具能够快速...