理想汽车发布的多功能一体化智能模型 Mind GPT-3o
Mind GPT-3o指的是什么? 理想汽车最新发布的多模态一体化大模型名为Mind GPT-3o,该模型结合语音、视觉与语言理解技术,实现了高效且即时的互动体验。具备记...
阿里通义开放的Agent应用构建平台 —— Qwen-Agent
Qwen-Agent指的是什么? Qwen-Agent是一款开源框架,旨在利用通义千问(Qwen)模型为开发者构建智能化代理应用程序提供支持。它具备指令遵循、工具操作、规划...
阿里开放源代码的低码开发平台 – LowCodeEngine
LowCodeEngine代表的是一个低代码开发平台。 阿里巴巴开源了低代码开发框架LowCodeEngine,通过提供诸如拖拽和配置这类简易操作手段,使得开发者能够迅速搭建...
海研一号 – 由中国科学院海洋研究所独立开发的海洋大型模型初步版
琅琊指的是什么? “琅琊”作为中国科学院海洋研究所独立研发的新一代人工智能海洋模型1.0版,主要致力于预测各种海洋状态变量。该模型巧妙融合了前沿的人工智...
PixVerse V3.5 —— 由爱诗科技研发的全新AI视频创作软件,具备1080p超清分辨率功能
PixVerse V3.5指的是什么? 爱诗科技最新发布的PixVerse V3.5是一款显著改进了性能与功能的AI视频制作工具。它能够以最快5秒的速度完成视频创作,并且在运动...
cc: Monet – 智能财务管理伙伴,高效辨识及管理发票、职员报销与审核程序
cc:什么是Monet呢? cc:Monet是一款专为简化企业财务管理流程而设计的AI财务助手应用。借助尖端的人工智能技术,它能够迅速应对发票管理、员工报销申报及审...
DynamicControl —— 由腾讯优图与南洋理工大学等多个机构共同研发的全新动态条件控制图像生成框架
DynamicControl指的是什么? DynamicControl是由腾讯优图与南洋理工、浙江大学等科研机构共同研发的一款创新框架,旨在将多模态大语言模型(MLLM)的推理能力...
UCLA 与谷歌共同发布 VideoPhy —— 用于检测视频生成模型物理理解水平的新标准
VideoPhy指的是什么 由UCLA与谷歌研究研究院共同开发的VideoPhy是首个专门用于评测视频生成系统对物理学原理理解程度的标准测试平台。该平台通过检测所产生视...
腾讯开放的StereoCrafter框架 —— 将普通二维视频转换成三维立体视效工具
StereoCrafter指的是什么 腾讯AI Lab与ARC Lab联手打造了创新工具StereoCrafter,该工具能够把单一视角(2D)影片转换成立体3D影片,以应对市场上对高质量3D...
大规模动态模型 —— 商汤科技与南洋理工大学共同开发的综合性多模态运动生成系统
大型运动模型是指什么 Large Motion Model(LMM)是由新加坡南洋理工大学S-Lab与商汤科技联合开发的一种综合性多模态运动生成框架。该模型能够应对从文本到动...