AI工具
Math24o – SuperCLUE:开源高中生奥赛数学推理评测标准
### 什么是Math24o? Math24o是一款专为评估大型语言模型(LLMs)数学推理能力而设计的测评基准工具。它基于高中奥林匹克数学竞赛的标准题目库构建,旨在帮...
RoboBrain:智源研究院开源的具身智能模型
RoboBrain是什么? RoboBrain是由智源研究院推出的开源具身智能大脑模型,旨在实现从单体智能到群体智能的跨越。该系统由三个核心模块构成:用于任务规划的基...
RoboOS:智源研究院推出首个机器人多模态协作框架
RoboOS:新一代多机器人协作操作系统 RoboOS是由智源研究院自主研发的首个面向多机器人的具身智能操作系统。该系统采用独特的'大脑-小脑'分层架构,创新性地...
Vidu Q1 – 生数科技推出的高可控视频大模型
什么是Vidu Q1 Vidu Q1是由清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授团队开发的先进视频大模型。该模型在多主体细节控制、音效同步...
港大联合Adobe推出全新图像编辑模型ObjectMover
什么是ObjectMover? ObjectMover是由香港大学和Adobe Research联合开发的一种创新图像编辑模型,旨在解决在移动、插入或删除图像中的物体时常见的光照不协调...
PhysGen3D:由清华大学等高校联合推出的基于单图的交互式三维场景生成工具
PhysGen3D是什么 PhysGen3D 是一个创新性的 3D 框架,能够将单张静态图像转换为可交互的动态 3D 场景,并生成具有物理真实感的视频内容。该系统结合了基于图...
EmotiVoice:网易有道开源AI语音合成系统
EmotiVoice是什么 EmotiVoice是由网易有道公司开源的一款先进的多语言、多音色文本到语音(TTS)合成系统。该系统不仅支持中英文双语转换,还提供了超过2000...
AI 3D建模神器:手绘草图秒变三维模型
Vibe Draw是什么 作为一款开源的AI 3D建模工具,Vibe Draw凭借其强大的功能和便捷的操作流程,正在迅速成为创意设计领域的热门选择。它能够将简单的2D涂鸦转...
OmniSQL:开源文本转SQL查询工具
OmniSQL概述 OmniSQL 是一个开源的文本到 SQL 转换模型,能够将自然语言问题高效地转换为精确的 SQL 查询语句。该系统通过创新性的数据合成框架构建了首个百...
AI动作捕捉工具:2D视频转换为3D运动数据
Move AI是什么 Move AI是一款革命性的AI动作捕捉工具,它采用了先进的无标记动作捕捉技术,结合人工智能和计算机视觉领域的前沿成果,能够将普通摄像头(包括...