AI工具

学者·万维InternVL 2.5 —— 上海人工智能实验室发布的多功能大型语言模型系列

书生·万象的InternVL 2.5版本指的是什么 万象InternVL 2.5是由上海AI实验室的OpenGVLab团队开发的一款开源大型语言模型系列,专注于处理多种类型的数据。相比...

YouTube配音——AI浏览器扩展程序,一键切换海外视频为常用语种播放

YouTube配音是指什么 YouTube Dubbing是一款适用于浏览器的插件,专为在线浏览国际视频内容而设计。它运用智能字幕匹配与AI驱动的配音技术来实时翻译并朗读出...

Gendo – 基于AI的建筑设计视觉化工具,迅速把初步设计或构思变为直观图像

Gendo指的是什么? Gendo是一款由人工智能驱动的专业建筑可视化工具,采用先进的生成式AI技术如GANs及Diffusion模型来高效地制作出高度真实的建筑设计图。该...

ChatTTSPlus – 一款开源的文本至语音转换软件,作为ChatTTS的增强版本,新增了语音模仿功能

ChatTTSPlus代表的是什么? ChatTTSPro作为ChatTTS的升级版本,引入了TensorRT加速、语音模仿及移动设备上的模型部署等功能点,显著增强了合成语音的质量与应...

MMAudio – 利用多模态协同训练技术打造高水准AI音频生成方案

MMAudio指的是什么? MMAudio是一种领先的将视频转换为音频的技术方案,它采用多模态融合训练的方式使模型能够跨越广泛的视觉听觉及音頻文字数据集进行学习。...

TalkMaster 应用 – 基于AI的英语学习工具,实现与人工智能即时交互并仿真实际会话环境

Speak APP指的是什么应用查看 TalkMaster是一款专注于英语口语练习的人工智能应用软件。该应用程序通过模拟实际对话情境,让用户能够与内置人工智能系统互动...

LiblibAI 发布的全方位 AI 图片创作服务平台 —— 星流AI

星流AI指的是什么? LiblibAI最新发布的星流AI是一款全面覆盖需求的AI图像创造平台,它依托自主研发的Star-3 Alpha通用图像生成模型,并融合了全球规模首屈一...

Ultravox – 全方位多媒体大型模型,直觉解析文字与人声

Ultravox指的是什么? Ultravox是一款先进的多模态大型语言模型(LLM),能够无需通过独立的自动语音识别(ASR)步骤来理解和解析文本及人声音频。借助多模态...

字节跳动发布的豆包语义向量化接口

豆包的向量转换API指的是什么? Doubao-embedding是一款由字节跳动开发的语义嵌入模型,专用于向量检索场景,并且能够处理中文和英文两种语言,其上下文长度...

多人协同AI虚拟空间创作平台 —— Patchwork (Midjourney 发布)

拼接作品是指什么 Patchwork 是由 Midjourney 开发的一款创新型多人合作的世界搭建工具,允许用户在无限扩展的画布上共同构思与创建虚拟世界。它融合了AI图像...
1 337 338 339 340 341 394